LOGIQUES NON CLASSIQUES


LOGIQUES NON CLASSIQUES
LOGIQUES NON CLASSIQUES

La logique formelle «classique» (cf. histoire de la LOGIQUE, LOGIQUE MATHÉMATIQUE, théorie de la DÉMONSTRATION) est une théorie de l’inférence valide qui ne prend pas en considération le contenu sémantique de l’argument. Elle est une logique bivalente, excluant toute position intermédiaire entre le vrai et le faux (tertium non datur : le tiers est exclu), et une logique extensionnelle.

Les logiques «non classiques», «déviantes» ou appliquées – l’incertitude des désignations témoigne de l’étendue des domaines d’application – recouvrent un large ensemble de systèmes qui, tout en demeurant des calculs formels, ne respectent pas l’un ou l’autre, ou plusieurs à la fois, des traits caractéristiques de la logique formelle classique. Ce sont des logiques à plus de deux valeurs de vérité (many-valued logic ), telles la logique intuitionniste [cf. INTUITIONNISME] et les logiques du flou, ou, tout au contraire, des logiques non vérifonctionnelles: la logique modale, la logique déontique, la logique épistémique, la logique des impératifs, la logique des interrogatifs... Entre les deux extrémités, d’autres systèmes prennent en charge l’analyse des degrés de confirmation (logique inductive), recourent à des critères de plausibilité (logiques non monotones), ou encore emploient des critères d’implication «affaiblis», entraînant des restrictions aux règles de la déduction.

Ensuite, à la différence de la logique traditionnelle, les logiques non classiques peuvent examiner la vérité et la fausseté des propositions dans leur rapport à l’action (logiques déontiques), au temps (logique temporelle), ou en relation avec le fait (nécessaires, possibles, ou contingentes, dans les calculs modaux). En d’autres termes, ces logiques présentent des contenus sémantiques: non seulement la temporalité ou les modalités, mais également la croyance et le savoir, les commandements, les interrogations, le permis et le défendu, la confirmation empirique et les présomptions de normalité, les interrogations, etc.

Enfin, la plupart de ces systèmes sont intensionnels et non simplement extensionnels: l’extension des expressions n’y est pas déterminée de façon non ambiguë, complètement et exclusivement par les extensions de leurs parties constitutives. Tel est notamment le cas des logiques modale, déontique, épistémique, temporelle, de la pertinence ou des logiques non monotones – bien que plusieurs de ces systèmes puissent être interprétés dans un cadre extensionnel.

Les logiques non classiques sont un champ en pleine expansion. Aux systèmes qui suivent (choisis en vertu de la généralité de leur portée), il faudrait ajouter, entre autres, la logique prohairétique (ou logique des préférences), la logique méréologique (ou des parties et des touts), les logiques paraconsistantes (ou «dialectiques»), la logique dialogique, la logique opératoire, la logique topologique.

1. Logique déontique

La logique déontique est l’étude formelle des énoncés comportant des expressions comme «il est permis de», «il est interdit de», «il est obligatoire de», «il est facultatif de». Moyennant des négations en nombre suffisant, ces expressions peuvent être définies à l’aide de l’une quelconque d’entre elles considérée comme fondamentale. En introduisant les notations OA, IA, PA et FA pour énoncer que A est respectivement obligatoire, interdit, permis et facultatif, on peut ainsi écrire: IA 沈 O 囹A, PA 沈 囹O 囹A («est permis ce qui n’est pas interdit») et FA 沈 囹OA & 囹O 囹A («est facultatif ce qui n’est ni obligatoire ni interdit»). On constate immédiatement que les relations entre O, I, P et F sont identiques à celles qui valent entre les modalités de la nécessité, de l’impossibilité, de la possibilité et de la contingence en logique modale .

Cette analogie structurale entre les modalités déontiques et les modalités ordinaires avait été remarquée très tôt (Leibniz en fait mention dans les années 1670). Mais le premier logicien à en faire un usage systématique est G. H. von Wright, dont l’article «Deontic Logic» marque en 1951 les débuts de la discipline. Von Wright présente un système fondé pour l’essentiel sur deux axiomes:

– Le principe de distribution déontique P(A 鈴 B) 沈 P(A) 鈴 P(B), dont une autre forme est: O(A & B) 沈 O(A) & O(B).

– Le principe de permission PA 鈴 P 囹A: de deux actions contraires, l’une doit être permise. Moyennant l’interdéfinissabilité de O et de P, ce principe équivaut à l’énoncé OAPA: car si OA 沈 囹P 囹A, OAPA et PA 鈴 P 囹A équivalent tous deux à 囹P 囹APA. Or la démontrabilité de OAPA («tout ce qui est obligatoire est permis») est manifestement exigible d’un système de logique déontique. On notera que OAPA est la version déontique du théorème 撚 A﨤A de la logique modale, mais que l’énoncé plus fort 撚 AA, pourtant démontrable dans la plupart des systèmes modaux, n’a pas d’équivalent déontique: il est patent que ce qui est obligatoire n’est pas toujours réalisé!

Ce premier système de logique déontique possède des propriétés formelles intéressantes (dont la décidabilité), mais il permet de démontrer des formules intuitivement inacceptables:

– Le paradoxe de l’obligation dérivée (A. N. Prior). Une obligation dérivée est du type O(AB) («il est obligatoire que, si l’on cesse le travail, on présente un certificat médical»). Or on peut démontrer dans le système de von Wright 囹PA囹P(A & 囹B) («s’il est interdit de faire A, il est interdit de faire A et quoi que ce soit d’autre»). On peut donc y prouver 囹PAO(AB) («l’accomplissement d’un acte interdit oblige à n’importe quel acte»), qui est tout à fait contre-intuitif: si je me gare à un endroit interdit, je devrai y laisser mon véhicule pendant une année entière... (on notera que ce paradoxe est l’analogue déontique du paradoxe de l’implication stricte de C. I. Lewis, selon lequel une proposition impossible implique strictement n’importe quelle proposition).

R. N. McLaughlin remarque en outre que la formule [OA & O(AB)]OB, démontrable dans le système, est peu plausible: s’il est obligatoire de se rendre à une cérémonie dans laquelle la tenue de soirée est de rigueur, peut-on soutenir que celui qui enfreint l’obligation mondaine en restant chez lui demeure tout de même astreint au port du smoking?

– Le paradoxe de Ross . Dans le système de von Wright, on peut également démontrer OAO(A 鈴 B): donc, si je suis obligé de porter assistance à autrui, je suis astreint à l’aider ou à le tuer.

Il n’est pas facile de remédier à ces apories, tant les ingrédients fondamentaux du système de von Wright (principes de permission et de distribution) semblent à la fois inévitables et anodins. Le diagnostic met en jeu l’analyse informelle des concepts normatifs, la sémantique des systèmes déontiques et, ultimement, l’ontologie des normes: est-il possible de conférer une signification aux énoncés normatifs sans supposer l’existence séparée d’un royaume du devoir-être (Reich des Sollens )? D’une certaine manière, le système initial de von Wright est encore trop proche des systèmes de logique modale ordinaire; les progrès ultérieurs ont résulté d’une analyse plus subtile des relations entre les modalités déontiques et les autres.

1. Les paradoxes que l’on vient d’énoncer proviennent en partie de l’hypothèse que la permission peut être définie, par analogie avec la possibilité usuelle, comme l’absence de la prohibition correspondante: en effet, seule cette définition permet d’écrire le principe (indiscutable) OAPA sous la forme du principe (douteux) de permission PA 鈴 P 囹A. Si l’on adopte cette définition de la permission, tous les systèmes de normes deviennent clos et sans «lacunes», c’est-à-dire que toute conduite y est qualifiée: une conduite, au cas où elle n’est pas interdite, est ipso facto permise. Mais cette propriété de clôture, bien qu’elle ait été jugée essentielle par des philosophes du droit comme H. Kelsen, n’est guère cohérente avec l’interprétation la plus courante de la pratique jurisprudentielle, selon laquelle il y a des cas où aucune norme générale ne se rapporte au cas particulier à examiner, les tribunaux saisis de ces cas devant alors créer des normes juridiques inédites pour combler la lacune en question. Il semble donc nécessaire d’introduire, à côté ou à la place de cette permission faible (est permis ce qui n’est pas interdit), une notion de permission forte , selon laquelle un type d’acte est considéré comme permis si l’autorité dont émanent les normes, ayant considéré son statut , a décidé de l’autoriser, c’est-à-dire d’un faire un droit en immunisant son auteur contre toute sanction et en interdisant aux autres agents d’entraver son effectuation. Naturellement, le principe PA 鈴 P 囹A ne vaut plus pour cette permission forte, laquelle se distribue selon le principe P (A 鈴 B) 沈 P (A) & P (B) («j’ai le droit de faire A ou B lorsque j’ai le droit de faire A et le droit de faire B»).

L’introduction de cette «permission forte» dans la logique déontique soulève cependant des problèmes délicats. En logique modale, on ne peut admettre l’énoncé:

qui contrevient au sens même des modalités: l’équivalence de A et de B peut n’avoir rien de nécessaire, puisqu’en logique propositionnelle deux propositions vraies sont considérées comme équivalentes (on y prouve A & B(A 沈 B)). On montre du reste que l’adoption de () conduirait à admettre une formule comme X撚 X, ce qui ferait évidemment perdre beaucoup d’intérêt à la logique modale! Par contre, la plupart des systèmes de logique modale (en tout cas ceux qu’on appelle des systèmes classiques , contrairement, par exemple, à S2 et à S3) admettent la règle d’inférence:

La règle (), nommée principe d’équivalence intensionnelle , stipule que, dans le contexte d’un opérateur modal, on peut toujours substituer l’une à l’autre deux propositions équivalentes, à condition qu’elles le soient prouvablement . Mais le principe de distribution P (A 鈴 B) 沈 P A & P B, accompagné de l’équivalence intensionnelle, conduit à des conséquences inacceptables: si l’on pouvait remplacer A par la formule prouvablement équivalente (A & B) 鈴 (A & 囹B) dans le contexte de l’opérateur P , de P A on pourrait déduire P (A & B), ce qui est intolérable («si j’ai le droit de faire A, alors j’ai le droit de faire A et B»...). On est donc placé devant le dilemme suivant:

– soit on renonce à la notion de permission forte, qui semble pourtant exprimer certaines propriétés importantes de notre concept préthéorique de la norme;

– soit on renonce à l’équivalence intensionnelle, en concédant que deux expressions, dont on sait pourtant prouver qu’elles sont coréférentielles, ne peuvent être substituées l’une à l’autre dans le contexte d’un opérateur déontique; on s’engage alors dans la construction d’une logique hyperintensionnelle (on a affaire à une situation très semblable dans la logique des conditionnels , où la vérité d’un énoncé comme «si l’on ouvrait la porte ou la fenêtre, il ferait plus frais» semble impliquer celle de «si l’on ouvrait la fenêtre, il ferait plus frais»).

À l’inverse, un procédé susceptible de couper court à toutes les difficultés spécifiques de la logique déontique a été suggéré par A. R. Anderson, qui proposait en 1958 de définir directement les opérateurs déontiques en termes des modalités usuelles par OA 沈 撚 (face=F0019 囹AS) et PA 沈 﨤(A & 囹S): «A est obligatoire exactement au cas où le non-accomplissement de A entraîne nécessairement (la sanction) S», et «A est permis lorsqu’il est possible d’accomplir A sans être sanctionné». Il est intéressant de constater que les théorèmes de la logique déontique, une fois traduits de cette manière dans le langage de la logique modale usuelle, deviennent des théorèmes de cette dernière logique. Mais la proposition d’Anderson se heurte évidemment à de sérieuses objections philosophiques: n’arrive-t-il jamais que nous nous dérobions à nos obligations tout en échappant à la sanction? Lorsque tel est le cas, devons-nous conclure que nos obligations n’en étaient pas vraiment? Mais comment conclure d’un énoncé factuel («j’ai échappé à la sanction») à un énoncé normatif («A n’est pas obligatoire»)?

2. Dans le système initial de von Wright, l’interprétation des formules déontiques n’est pas claire, et notamment celle de leur partie propositionnelle. Bien que les modalités déontiques semblent porter sur des propositions A, B, ..., lesdites propositions doivent être conçues non comme des descriptions d’états de choses, mais comme des noms d’actes, et, plus précisément, des noms d’actes génériques (l’assassinat), et non d’actes individuels (l’assassinat de César): le recours aux actes génériques permet d’éviter la quantification en logique déontique. Mais l’application des connecteurs usuels à ces noms d’actes ne va pas de soi: que peut représenter la négation d’un acte générique? Pour répondre à ce problème, von Wright a été conduit à développer une logique de l’action . L’action notée p T q y est définie comme une transition d’un p -monde (où l’état de choses p est réalisé) à un q -monde (p est la précondition de l’action, et q son résultat ). Ce sont précisément ces actions possibles et leurs composés propositionnels qui constituent le contenu des normes. Ce formalisme permet de définir pour chaque action une négation externe (l’action considérée n’est pas effectuée) et une négation interne (c’est l’action opposée qui est effectuée). De plus, cette logique de l’action montre l’irrecevabilité du principe de distribution déontique. Si A et B sont des actes, P(A 鈴 B) entraîne PA 鈴 PB au cas où A et B ont les mêmes conditions d’application. Si, par contre, les conditions d’application de A et de B sont distinctes, ce n’est plus le cas: la permission inconditionnelle de laisser ouverte la porte ou la fenêtre n’entraîne nullement la permission inconditionnelle de laisser la porte ouverte, ou celle de laisser la fenêtre ouverte (par exemple on peut permettre de laisser la porte ouverte sauf la nuit et la fenêtre ouverte sauf le jour).

Si les contenus des normes sont des actions, la logique déontique se différencie encore de la logique modale ordinaire sous un autre aspect: il est difficile d’envisager l’itération des modalités déontiques (par exemple: POA, il est permis que A soit obligatoire»), sauf peut-être à considérer l’édiction même d’une norme comme une action d’un certain type. La formalisation des hiérarchies de normes déontiques (par exemple: «il m’est permis d’obliger X à me rembourser») devra donc recourir à d’autres procédés que la concaténation des modalités O et P. La solution la plus fréquemment adoptée fait appel à des opérateurs binaires de modalité, qui mettent en relation une autorité et le contenu de la norme qu’elle édicte (par exemple: Px Oy A [«l’autorité x , déléguant à y une partie de son pouvoir, l’habilite à obliger z à A»]).

3. La logique déontique s’interprète le plus couramment dans la sémantique kripkéenne des mondes possibles: dire qu’un individu est obligé à A, c’est dire que A est vrai dans tous les mondes compatibles avec ses obligations. L’adoption de ce type de sémantique tend à reléguer à l’arrière-plan les discussions traditionnelles sur le point de savoir si les énoncés normatifs peuvent être dits vrais ou faux: la réponse, au moins sur le plan technique, est clairement affirmative. La particularité des opérateurs déontiques exige cependant certains aménagements de la sémantique des mondes possibles.

Dans la structure 麗W, 倫, v 礪, l’antécédent de la relation 倫 d’accessibilité – ou, mieux, de permissibilité – sera toujours le même, à savoir le «monde actuel» w . C’est là une conséquence du refus d’itérer les modalités déontiques: il ne sera jamais nécessaire d’envisager des mondes accessibles à un monde w lui-même accessible à w . Du même coup, les propriétés de symétrie et de transitivité de 倫 n’auront plus de sens. D’autre part, il est exclu que 倫 soit réflexive. En effet, on dira que:

Mais, si 倫 était réflexive, w serait un tel w : on devrait donc en conclure que tout ce qui est obligatoire (dans le monde actuel) est réalisé dans le monde actuel, ce qui est absurde. Or, si l’on rejette la réflexivité de 倫, rien ne garantit plus que tout ce qui est obligatoire est permis. Il faut donc ajouter une clause supplémentaire à (\#) qui stipule que, à défaut d’être vraies dans le monde actuel, les propositions obligatoires sont vraies dans au moins un monde possible: il serait absurde que les obligations ne puissent pas être réalisées. On ajoutera donc au membre de droite de (\#) la clause:

Si l’on définit maintenant la nécessité (resp. la possibilité) de A comme sa vérité dans tout (resp. au moins un) monde possible, permissible ou pas, on obtient alors les relations: nécessaireobligatoirepermispossible . La sémantique ainsi construite sera appelée leibnizienne , en vertu de sa conformité au principe de Leibniz selon lequel tout ce qui est nécessaire est obligatoire (omne necessarium debitum est ). Mais le concept d’obligation sous-jacent à ce principe est contestable. On peut, au contraire, estimer avec H. Kelsen que l’existence d’une obligation suppose la possibilité d’une conduite qui la transgresse, et qu’une norme qui prescrirait une action dont on sait par avance qu’elle sera réalisée en tout temps et en tout lieu n’a guère de sens. Une sémantique kelsenienne adéquate pour ce dernier concept d’obligation sera obtenue si l’on stipule en outre que, si A est obligatoire, il existe un monde (forcément non permissible) dans lequel A est faux, c’est-à-dire si l’on adjoint au membre de droite de (\#) la clause (\#\#) et une nouvelle clause:

Dans ces conditions, OA est faux non seulement s’il existe un monde permissible où A est faux, mais aussi si A se trouve vrai dans tous les mondes possibles.

2. Logique épistémique

L’un des objectifs d’une théorie de la connaissance est de parvenir à une description satisfaisante des concepts de «croire» et de «savoir». À supposer cette tâche réalisée de manière suffisamment systématique, on pourra donner des propriétés de ces deux concepts et de leurs relations mutuelles une définition axiomatique (dans une perspective plus modeste, ces définitions axiomatiques serviront au moins à clarifier diverses options possibles, à en formuler explicitement les présupposés ou à en vérifier la cohérence).

On appellera logique épistémique tout système formel construit sur la base d’un langage comportant des opérateurs de « croyance » et de «savoir». Il convient toutefois de préciser que la propriété d’être «épistémique» n’est aucunement une propriété intrinsèque d’un système formel, mais plutôt une propriété que nous serions éventuellement disposés à lui attribuer au cas où l’une de ses interprétations coïnciderait, au moins partiellement, avec les résultats d’une analyse informelle des concepts de «croire» et de «savoir». Cette mise au point effectuée, on sacrifiera dans la suite à l’usage et à la brièveté en parlant de «logique épistémique», et non d’«interprétation épistémique d’un système formel» comme devrait être le cas.

Formellement, les expressions «a sait que» et «a croit que» sont des opérateurs qui, appliqués à des propositions, en produisent de nouvelles. Ces opérateurs ne sont pas vérifonctionnels: dans le contexte d’un opérateur épistémique, il est généralement impossible de substituer l’un à l’autre deux énoncés de même valeur de vérité sans modifier la valeur de vérité de la phrase tout entière. Ainsi, bien que «John Steinbeck est John Steinbeck» et «John Steinbeck est l’auteur de À l’est d’Éden » aient même valeur de vérité, la vérité de la proposition «a sait que John Steinbeck est John Steinbeck» n’entraîne nullement la vérité de «a sait que John Steinbeck est l’auteur de À l’est d’Éden ». Tout cela apparente étroitement «a sait que» et «a croit que» à des modalités (cf. Logique modale ), que l’on notera, conformément à l’ouvrage séminal de Hintikka (1962), Ka et Ba .

Une difficulté toutefois interdit de considérer la logique épistémique comme une pure et simple interprétation des systèmes de logique modale déjà constitués. L’interdéfinissabilité des deux symboles fondamentaux de modalité ( 﨤P 沈 囹 撚 囹P et 撚 P 沈 囹 﨤 囹P), très raisonnablement tolérée par l’interprétation déontique (cf. Logique déontique ) de ces deux symboles («P est permis s’il n’est pas défendu, et obligatoire si non-P n’est pas permis»), ne s’étend pas aux concepts épistémiques. Aucune définition convaincante du savoir en termes de croyance n’a même jamais été proposée. La plus naturelle, soit Ka P 沈 (Ba P & P)(«le savoir est une croyance vraie»), a des conséquences intolérables: d’un individu qui, observant à midi le cadran d’une pendule hors d’usage dont les aiguilles sont justement fixées sur midi, en conclut qu’il est midi, dirions-nous qu’il sait l’heure? Des conditions supplémentaires sont donc exigibles, de nature encore peu claire. Selon A.I. Goldman (1967), on ne saurait créditer a de la connaissance de P que si sa croyance en P est causalement déterminée par P. Cette suggestion, développée par F. I. Dretske (1981) dans le cadre de la théorie de l’information, ne saurait toutefois convenir lorsqu’il s’agit d’une connaissance non factuelle: quel type d’influence causale les formes quadratiques pourraient-elles exercer sur le mathématicien? On se résignera donc à voir dans les opérateurs Ka et Ba deux modalités irréductiblement distinctes. Une variante particulièrement austère de ce renoncement consiste à scinder la logique épistémique en deux disciplines séparées: la logique épistémique stricto sensu, qui aura pour objectif la formalisation du concept de savoir, et la logique doxastique , attachée à celle de la notion de croyance (la terminologie réfère évidemment à Platon, dont le Théétète disjoint radicalement la science [ 﨎神晴靖精兀猪兀] et l’opinion vraie [ 見凞兀兀﨟 嗀礼﨡見]).

Dans le discours usuel, il n’y a pas de symétrie entre «a croit que P» et «a sait que P». Si la première expression réfère simplement à une attitude à l’égard de la proposition P, la seconde présuppose en outre la proposition P elle-même. Dans l’usage ordinaire, «a sait que P» ne semble ni assertable ni déniable lorsque P est faux (ou supposé tel par le locuteur). Le cas où a désigne l’auteur même de l’énonciation («je ne sais pas que P») soulève d’ailleurs de subtiles difficultés, analysées par Hintikka (1962). La logique épistémique prend le parti de disjoindre les deux composantes – l’explicite et la présupposée – du «a sait que» familier: l’expression Ka P y est interprétée, au même titre que l’expression Ba P, comme la pure expression d’une attitude propositionnelle. En d’autres termes, Ka P implique , mais ne présuppose plus P: dans la logique épistémique, la paire囹Ka P, 囹P est cohérente. Du même coup, les écritures contenant le symbole K deviennent difficiles à paraphraser: face=F0019 囹Ka P n’est rendu ni par «a ne sait pas que P», qui présuppose P, ni par «a ne sait pas si P», qui sous-entend 囹Ka 囹P... On devra donc souvent renoncer à chercher des équivalents vernaculaires aux énoncés de la logique épistémique.

La logique épistémique stricto sensu peut être conçue comme une simple réinterprétation des systèmes traditionnels de logique modale. Si l’on adjoint l’opérateur Ka au langage de la logique propositionnelle, et que l’on ajoute à une quelconque de ses axiomatisations les formules:

et la règle d’inférence X 輦 Ka X («de X, inférer Ka X»), on obtient une variante TK du système T de la logique modale propositionnelle. (K1) énonce que tout ce qui est su est vrai – (K1) n’aura évidemment pas d’équivalent dans une logique doxastique –, et (K2) et la règle d’inférence additive expriment que a est un parfait logicien: il sait utiliser le modus ponens , et il connaît toutes les tautologies (c’est le postulat d’omniscience logique ).

Le système S4K de logique épistémique s’obtient en ajoutant à TK l’axiome:

dit d’introspection positive («lorsque a sait une chose, il sait qu’il la sait»).

Enfin, le système S5K s’obtient par ajout à TK de l’axiome:

dit d’introspection négative («lorsque a ignore une chose, il sait qu’il l’ignore»): (K4) est manifestement une variante de l’axiome 﨤P撚 﨤P du système S5 de la logique modale.

Il est clair que la notion de connaissance ainsi formalisée est fort loin de refléter le savoir ordinairement manifesté, et qu’elle en décrit une forme extrêmement idéalisée. En particulier, l’introspection négative pourra sembler difficilement compatible avec l’existence de croyances erronées: il suffirait de se réfugier dans l’agnosticisme pour éviter l’erreur! Admettons en effet la formule Ba PBa Ka P. Alors la supposition Ba P & 囹P d’une croyance fausse est intenable: face=F0019 囹P implique 囹Ka P, et donc Ka 囹Ka P par introspection négative; mais Ba Ka P et Ka 囹Ka P sont peu cohérents (a peut difficilement savoir quelque chose et croire le contraire).

L’omniscience logique elle-même est peu vraisemblable: peut-on dire que celui qui connaît les axiomes de Peano connaît aussi la totalité des théorèmes qui en dérivent? Il n’est pas sûr que les systèmes canoniques de logique modale, qui enregistrent de manière à peu près satisfaisante le sens intuitif des modalités «aléthiques» (nécessité et possibilité), sont en outre capables de formaliser la notion de savoir. Sitôt que l’on construit la logique épistémique comme une extension conservative de la logique usuelle, l’omniscience logique est inévitable: tout ce qui est logiquement vrai doit être su. Peut-on procéder autrement? La construction d’une logique épistémique reposant sur des hypothèses idéalisatrices moins fortes suppose que l’on clarifie la nature des obstacles à l’effectuation des inférences déductives, et que l’on parvienne à une évaluation objective de leur difficulté. Hintikka suggérait en 1975 que la difficulté d’une inférence soit mesurée par le nombre de constantes d’individus nouvelles qui y sont introduites. En effet, pour déduire 祥a 1 ... a n à partir de 﨏a 1 ... a n , il est généralement nécessaire de passer par des énoncés du type a 1 ... a n b 1 ... b p : les exemples abondent en géométrie élémentaire, où les individus b 1, ..., b p sont appelés «constructions auxiliaires» (pour montrer que la somme des angles d’un triangle est égale à 2 神, on doit introduire une droite, parallèle à l’un des côtés, qui ne figure pas dans la donnée du problème). Mais Hintikka, qui a donné par ailleurs (1973) une définition rigoureuse de cette «profondeur logique» d’une inférence, n’est pas revenu sur son utilisation éventuelle dans la construction d’une logique épistémique.

La sémantique initialement proposée par Hintikka pour la logique épistémique repose sur la notion d’ensemble modèle (model set ): il s’agit d’ensembles de formules cohérents et déductivement clos. On définit sur l’ensemble 行 (model system ) de ces ensembles modèles une relation d’alternance épistémique par rapport à a , et l’on impose la condition suivante: pour 猪 et 猪 dans 行, Ka P 捻 猪 exactement si P 捻 猪 pour chaque 猪 qui alterne avec 猪. Dans le langage des mondes possibles: Ka P est vrai dans 猪 lorsque P est vrai dans tout monde possible alternant par rapport à 猪.

La sémantique de Hintikka se laisse aisément reformuler dans les termes de la sémantique kripkéenne des mondes possibles. Elle consiste en la définition d’une structure 麗W, 倫a , v 礪, où W (équivalent du model system 行 de Hintikka) est un ensemble de mondes possibles, 倫a (contrepartie de la relation d’alternance épistémique) est une relation binaire sur W et v: W 憐 硫索V, F est une fonction de valuation comportant la clause: v(w , Ka A) = V exactement si v(w , A) = V pour chaque w tel que wa w . Intuitivement, l’ensemble des w qui satisfont cette condition est l’ensemble des états de choses cohérents avec la connaissance de a en w : pour autant que a sache (en w ), w pourrait être comme w . Quand on dispose du savoir de a , on ne peut distinguer ces w les uns des autres, puisqu’ils ne diffèrent justement que sur les points ignorés par a . Le principe général de cette sémantique est donc le suivant: imputer à quelqu’un une attitude propositionnelle (comme la connaissance, mais aussi la croyance, etc.) consiste à sélectionner l’ensemble des mondes possibles compatibles avec le contenu de cette attitude.

De la même façon qu’en logique modale «ordinaire», les propriétés algébriques de la relation 倫a permettent de spécifier les classes de structures qui caractérisent respectivement TK, S4K et S5K:

– la réflexivité de 倫a répond à l’axiome Ka PP: lorsque wa w , v(w , Ka P) = V implique v(w , P) = V;

– l’ajout de la transitivité reflète l’addition de l’axiome d’introspection positive;

– enfin, on obtient l’introspection négative en ajoutant la symétrie aux propriétés précédentes, comme le montre le schéma suivant:

(il suffit de montrer que dans cette situation 囹Ka P est vrai en w . Mais, puisque les flèches se parcourent dans les deux sens (symétrie) et se prolongent les unes les autres (transitivité), w (où P est faux) est accessible à partir de w ).

La logique épistémique qui a été décrite jusqu’ici ne met en jeu qu’un seul agent (l’opérateur Ka n’est pas décomposé). Mais les principes en jeu s’étendent sans difficulté à une situation où plusieurs agents sont impliqués. Cette extension de la logique épistémique à l’analyse de systèmes d’agents en interaction a été récemment entreprise dans un domaine passablement éloigné des préoccupations philosophiques des fondateurs: la théorie des systèmes informatiques répartis. Ici, les agents épistémiques sont des processeurs qui travaillent en parallèle et peuvent avoir à échanger des informations (opérandes...). Pour formaliser la communication dans un système de n processeurs, on suppose construit un ensemble 硫 de formules contenant tout énoncé atomique du type «le contenu de la variable locale z du processeur i est r », «le processeur j est dans l’état e », etc., et tous les énoncés formés à partir d’eux à l’aide des opérateurs logiques usuels et des opérateurs épistémiques K1, ..., Kn (Ki Kj P sera par exemple rendu par «le processeur no i sait que le processeur no j sait que P»). Les termes «connaissance» et «savoir» sont naturellement pris ici en un sens purement externe: le «savoir» du j -ième processeur est la classe des informations que le maître d’œuvre du système, s’il était doué de capacités de détection suffisantes, serait fondé à considérer comme disponibles pour ce processeur à un instant donné.

Une structure pour la logique épistémique à n agents sera la donnée d’un (n + 2)-uple 麗W, 倫1, ..., 倫n , v 礪, où les relations binaires 倫i sur W sont relativisées à chaque agent (la fonction v de valuation comportera la clause: v(w , Ki A) = V exactement si v(w , A) = V pour chaque w tel que wi w ).

Dans le cas d’un système distribué de processeurs, les éléments w de W sont les états possibles instantanés du système global. Ainsi, si A est l’énoncé «le processeur no 1 est dans l’état e », 囹K3A sera interprété comme suit: «il existe un état global w du système que le processeur no 3 ne sait pas distinguer de l’état global actuel, et dans lequel le processeur no 1 n’est pas dans l’état e ».

En assimilant à une structure de Kripke toute collection de processeurs interconnectés, on parvient à exprimer en termes épistémiques certaines caractéristiques organisationnelles des systèmes distribués. L’une de ces caractéristiques éventuelles est la synchronie (un système est dit synchrone lorsqu’une horloge interne permet à l’unité centrale d’envoyer des «tops» à tous les processeurs simultanément, et asynchrone, au contraire, s’il n’y a que des temps locaux , particuliers à chaque processeur). Dans le cas synchrone, les messages entre processeurs sont échangés par cycles réglés sur l’horloge centrale. Une nouvelle modalité épistémique C, spécifique des systèmes cognitifs à plusieurs agents, permet de rendre compte de cette différence entre synchronisme et asynchronisme: la notoriété publique (common knowledge ). Une proposition est dite notoire lorsque chaque agent la connaît, que chaque agent sait que chacun la connaît, que chacun sait que chacun sait que chacun la connaît, etc. En abrégeant «chacun sait que 﨏» par E 﨏 (E 﨏 沈 炙i K 﨏), on peut exprimer la notoriété de 﨏 par: C 﨏 沈 E 﨏 & EE 﨏 & EEE 﨏 ...). Les systèmes synchrones sont ceux dans lesquels le nombre de cycles est de notoriété publique, les systèmes asynchrones sont ceux dans lesquels les seules propositions notoires sont les identités de la logique.

On peut de la même façon définir la modalité I de connaissance implicite : 﨏 est implicitement connue au cas où elle serait connue de tous les agents si ces derniers coopéraient en mettant leur savoir en commun. Bien entendu, l’intérêt théorique des modalités C et I excède de beaucoup la seule analyse des systèmes informatiques multiprocesseurs: un certain nombre de traits fondamentaux dans les domaines de l’économie, de la politique et de la stratégie sont probablement formalisables par ce biais. On se contentera de renvoyer ici à l’ouvrage de D. K. Lewis (1969) sur les conventions, où le concept de notoriété joue un rôle essentiel.

3. Logiques du flou

Les langues naturelles comportent des termes vagues , c’est-à-dire des termes tels que la question de savoir s’ils s’appliquent à un objet donné n’a pas toujours de réponse définie, même en présence de toute l’information factuelle sur cet objet. On ne confondra le vague ni avec la généralité (un terme est général quand son extension contient plus d’un objet) ni avec l’ambiguïté (un terme est ambigu lorsqu’il en existe des occurrences non coextensives). La logique est apte à traiter des termes généraux – au moyen de la quantification. L’ambiguïté peut être réduite par introduction de nouveaux termes («serviette 1» pour les cartables, et «serviette 2» pour les torchons) ou par spécification des conditions de l’énonciation pour les termes dont l’extension varie régulièrement en fonction de ces conditions («je», «ici», «maintenant»). Par contre, la logique ne s’accommode pas du vague. Le principe de bivalence (un énoncé bien formé est vrai ou faux) exige que chaque prédicat soit clairement délimité: un objet quelconque a appartient, ou n’appartient pas, à l’extension d’un prédicat donné 﨏. L’énoncé 﨏a est vrai dans le premier cas, faux dans le second. Tertium non datur.

Le langage naturel semble donc peu fidèle à la sémantique bivalente en vigueur dans la logique classique. Dès lors, trois attitudes sont possibles. On peut laisser les langues naturelles à leur polysémie, en estimant que la logique n’a affaire qu’aux langages formels univoques qu’elle a développés pour son propre compte (c’est l’attitude de Frege). On peut aussi penser que les langues naturelles ne contreviennent qu’en apparence aux principes logiques usuels, et qu’une analyse qui dépasse la forme grammaticale superficielle des énoncés ordinaires doit mettre au jour une forme logique sous-jacente conforme à ces principes (par exemple, Russell estime que la forme authentique de l’énoncé «l’actuel roi de France est chauve», qui paraît n’être ni vrai ni faux, est l’énoncé «il existe un unique individu qui règne aujourd’hui en France, et cet individu est chauve», qui, lui, est faux). On peut enfin demander que la logique traditionnelle soit étendue ou réformée pour rendre compte des aspects récalcitrants du langage ordinaire. Ce sont des réalisations inspirées par ce dernier point de vue dont il sera ici question.

Logiques trivalentes

En ajoutant une autre valeur de vérité I («indéterminé») aux deux valeurs classiques V et F, on construit une sémantique trivalente. Les logiques trivalentes et, plus généralement, n -valentes (n 礪 2) sont vérifonctionnelles (la valeur d’un énoncé complexe est une fonction de la valeur de ses constituants). Il en existe de nombreux systèmes, qui se distinguent par leurs tables de vérité.

Le système de Kleene

En 1938, S. C. Kleene a proposé, pour formaliser l’usage des propositions indécidables en mathématiques, une logique trivalente définie par les tables de vérité suivantes:

I est interprété comme «indécidable»: c’est la valeur des énoncés qui ne sont ni démontrables ni réfutables (selon Kleene, ils sont vrais ou faux, mais on ignore quel est le cas). Le système de Kleene repose sur le principe suivant:

() On assigne à un énoncé complexe A possédant des constituants de valeur I la valeur commune que donneraient à A toutes les assignations possibles de V ou de F à ces constituants, si cette valeur commune existe, et la valeur I sinon.

Par exemple, si p est V et q est I, pq est V; car si q était V, pq serait V, et si q était F il en irait de même. Par contre, dans les mêmes conditions, p & q est F; car si q était V, p & q serait V, mais si q était F, p & q serait F.

Cependant, le principe () ne peut être toujours appliqué si le système doit rester vérifonctionnel. Car, dans ce cas, une disjonction de deux énoncés I doit toujours être I. Mais si p est I, p 鈴 囹p (principe du tiers exclu) est une telle disjonction. On doit donc renoncer à donner à p 鈴 囹p la valeur V, ce que permettrait pourtant le principe (). Dans le système de Kleene, le principe du tiers exclu n’est donc pas une tautologie. Il en va de même pour le principe de non-contradiction 囹(p & 囹p ). Il y a là un dilemme typique des «logiques floues»: on doit sacrifier la vérifonctionnalité, ou invalider certaines tautologies classiques.

Le système de Lukasiewicz

Historiquement, il s’agit d’un système destiné à traiter la question aristotélicienne des futurs contingents («il y aura une bataille navale demain»): si l’on admet le principe de bivalence pour ces énoncés, on est contraint d’adopter une certaine forme de fatalisme, que l’on voudrait justement éviter. On leur attribuera donc la valeur I, dont la signification est ici plus forte que chez Kleene: il s’agit d’une indétermination «métaphysique» (ces énoncés ne sont ni vrais ni faux), et non pas seulement «épistémique» (nous ne savons pas s’ils sont vrais ou s’ils sont faux). Cette différence d’intention n’a guère de répercussions techniques: le système de Lukasiewicz est le même que celui de Kleene, à l’exception de l’implication, désormais définie par:

Ce système n’est malheureusement pas très adapté à son objectif initial. Comme chez Kleene, le principe du tiers exclu n’est plus une tautologie. Or, demain, une bataille navale aura lieu, ou n’aura pas lieu... Il a été cependant utilisé par la suite à d’autres fins. En particulier, H. Reichenbach, en 1944, l’a pris pour base d’une logique quantique destinée à prévenir les conséquences des «anomalies causales» de la mécanique quantique: on y assigne la valeur I à tout énoncé qui fait référence à des propriétés impossibles à mesurer dans certaines circonstances.

Enfin, ce système trivalent se généralise facilement à un système à 4, 5, ..., ou une infinité de valeurs, selon les principes suivants: v(face=F0019 囹p ) = 1 漣 v(p ), v(pq ) = sup[v(p ), v(q )], v(p & q ) = inf[v(p ), v(q )], et v(pq ) est égal à 1 si v(p ) 諒 v(q ) et à 1 漣 v(p ) + v(q ) sinon. Le cas trivalent s’obtient à partir de ces règles en identifiant V à 1, I à 1/2 et F à 0.

Le système de Bochvar

Proposé en 1939 pour traiter les phrases dénuées de sens ou paradoxales (par exemple: «la présente phrase est fausse», qui est vraie si elle est fausse, et fausse si elle est vraie), le système de Bochvar présente des caractéristiques très différentes des deux premiers. Il est défini par les tables suivantes:

On notera que ce système ne répond pas non plus à son objectif initial: interdire la formation d’un paradoxe comme celui du « menteur ». En effet, un énoncé paradoxal du type incriminé peut se reformuler en termes de V, I et F, à savoir l’énoncé «le présent énoncé est faux ou indéterminé», qui est vrai s’il est faux ou indéterminé, et faux ou indéterminé s’il est vrai...

La caractéristique essentielle du système de Bochvar est d’offrir une logique «contagieuse» du flou: il suffit pour qu’un énoncé complexe soit indéterminé que l’un de ses composants soit dans ce cas. Autrement dit, par opposition aux deux systèmes précédents où le caractère indéterminé est récessif (pour autant que la vérifonctionnalité le permette, on donne aux énoncés complexes l’une des deux valeurs classiques), le caractère indéterminé est ici dominant .

La sémantique des supervaluations

Est-il possible de construire un système dans lequel les valeurs V et F seraient totalement dominantes, c’est-à-dire dans lequel un principe analogue au principe () de Kleene serait toujours appliqué (on a vu qu’un système de ce type ne serait plus vérifonctionnel). On peut estimer que la sémantique des supervaluations (B. van Fraassen, 1969) réalise cette idée. Ce système est destiné à formaliser le phénomène de la présupposition dans les langues naturelles: on dit que A présuppose B si A n’est ni vrai ni faux lorsque B n’est pas vrai («l’actuel roi de France est chauve» présuppose «il y a actuellement un roi en France»). Dans le cas où B est faux, A constitue une lacune de valeur de vérité (truth value gap ). La construction de van Fraassen doit rendre compte du fait que certaines propositions qui contiennent des constituants lacunaires semblent malgré tout susceptibles de vérité ou de fausseté (par exemple: «si l’actuel roi de France est chauve, alors l’actuel roi de France est chauve»). Par définition, une supervaluation S assigne à un énoncé complexe contenant des constituants lacunaires la valeur commune que lui donneraient toutes les valuations classiques (bivalentes) si cette valeur existe, et aucune valeur sinon.

Par exemple, S donnera au principe du tiers exclu la valeur V, puisque toutes les valuations classiques donnent à p 鈴 囹p la valeur V (on remarquera que l’abandon du principe sémantique de bivalence n’entraîne pas nécessairement l’abandon du principe du tiers exclu). Par contre, pq sera démuni de valeur si p et q en sont déjà dépourvus. La sémantique des supervaluations n’est donc par vérifonctionnelle: il ne s’agit pas là d’une logique multivalente. Par contre, les supervaluations sont plus proches de la logique classique en ce qu’elles donnent la valeur V à toutes les tautologies classiques, et la valeur F à toutes les contradictions.

K. Fine, en 1975, a développé une idée analogue pour traiter les énoncés ambigus ou vagues: un énoncé ambigu sera considéré comme vrai s’il est vrai pour toutes les façons de lui enlever son ambiguïté.

La théorie des ensembles flous

S’agissant des prédicats vagues du discours ordinaire, le défaut le plus visible des logiques trivalentes est le suivant: on y considère que l’assignation d’une valeur classique V ou F à l’énoncé 﨏a est injustifiable lorsque a est un cas limite de 﨏, et on lui attribue une tierce valeur. Mais, à côté des objets x dont il est indiscutablement indécidable s’ils sont des 﨏, et pour lesquels 﨏x mérite sans conteste ce traitement, il y a aussi des objets y dont il est douteux que l’on puisse douter s’ils sont des 﨏, et pour lesquels il est donc tout aussi injustifiable de conférer à 﨏y la valeur «indéterminé». On commet une erreur du même type lorsqu’on s’imagine qu’une politique terminologique inflationniste peut mettre un terme au vague des prédicats naturels: en créant «pré-adolescence» pour désigner l’âge intermédiaire entre l’enfance et l’état adulte, on fait surgir, entre les pré-adolescents manifestes et les authentiques bambins, la légion hybride des pré-pré-adolescents...

Cela suggère d’abandonner la tripartition de l’univers du discours entre les objets x pour lesquels 﨏x est vrai, indéterminé, ou faux, au profit d’une transition graduelle entre les premiers et les derniers. Cette notion d’une subsomption graduée des objets sous les prédicats vagues est le point de départ de la théorie des ensembles flous développée par L. I. Zadeh depuis 1965. Un ensemble flou F y est défini comme la donnée d’un référentiel 行 et d’une application 猪F: 行[0, 1] ( 猪(x ), «degré d’appartenance de x à F», désigne intuitivement le degré auquel le prédicat vague F convient à l’objet x ). La 見-coupure de F est l’ensemble (au sens usuel) des individus x pour lesquels 猪F(x ) 閭 見. En particulier, la 0-coupure stricte (ou support ) de F est l’ensemble des objets dont le degré d’appartenance à F est non nul, et la 1-coupure (ou noyau ) de F contient les objets typiques de F (ceux auxquels le prédicat F convient «pleinement»). On définit sur ces ensembles flous des relations et des opérations analogues à celles de la théorie des ensembles ordinaires. Pour F et G relatifs à un même référentiel 行, on dit que F est inclus dans G lorsque 猪F minore 猪G, et égal à G lorsque 猪F = 猪G. Par ailleurs, dans la définition la plus répandue, 猪 size=1錄(x ) = 1 漣 猪F(x ), 猪F size=1 G(x ) = sup[ 猪F(x ), 猪G(x )] et 猪F size=1 G(x ) = inf[ 猪F(x ), 猪G(x )] pour chaque x de 行. Ces définitions préservent plusieurs propriétés des ensembles usuels. Par exemple, l’intersection est commutative: 猪F size=1 G = 猪G size=1 F. Mais on ne récupère pas toute la structure (de treillis de Boole) qui est celle de l’ensemble des parties «ordinaires» de 行. Ainsi, ni le principe du tiers exclu ni le principe de non-contradiction ne sont corrects: 猪F size=1 size=1錄 n’est pas l’application constante 1, et 猪F size=1 size=1錄 n’est pas l’application nulle: on sait seulement que 猪F size=1 size=1錄(x ) (resp. 猪F size=1 size=1錄(x )) est supérieur (resp. inférieur) à 1/2 pour chaque x de 行. Si l’on veut préserver la fonctionnalité de la théorie, c’est-à-dire si l’on exige que 猪F size=1 G et 猪F size=1 G soient des fonctions qui ne dépendent que de 猪F et de 猪G, c’est inévitable: on peut montrer qu’il n’existe dans ce cas aucune définition de 猪F size=1 G, de 猪F size=1 G et de 猪 size=1錄 qui permette de conserver le tiers exclu et la non-contradiction sans sacrifier l’idempotence ( 猪F size=1 F = 猪F size=1 F = 猪F). La théorie des ensembles flous n’échappe donc pas au dilemme mentionné plus haut.

Par ailleurs, cette théorie se prête fort bien à la formalisation de plusieurs aspects importants du langage naturel. On peut y définir des opérateurs qui semblent fidèlement refléter la manière dont les adverbes très , peu ... modifient les adjectifs vagues auxquels ils sont attachés: les plus importants sont les opérateurs de compression et d’intensification (ou d’augmentation de contraste) et leurs inverses. Ainsi l’opérateur COM2 de compression, qui correspond à l’adjectif très , est défini par 猪COM2(F) (x ) = [ 猪F(x )]2; il transforme de la manière suivante l’ensemble flou auquel on l’applique:

On sait depuis longtemps que les prédicats vagues se prêtent à certains paradoxes. Ainsi du « sorite », vraisemblablement formulé pour la première fois par Eubulide, de l’école de Mégare, à propos de l’exemple archétypique du «tas» ( 靖礼福礼﨟): un seul grain de blé ne constitue pas un tas; puisqu’un grain de blé n’est pas un tas, et que l’ajout d’un grain ne saurait transformer en tas une collection de grains qui n’en est pas déjà un, aucune collection de grains n’est un tas (ou encore, dans une version due à H. Wang: la classe des petits entiers, qui contient zéro et qui est close pour l’opération successeur, devrait les contenir tous). Le paradoxe peut se préciser ainsi: si l’on note T(n ) l’énoncé «n grains forment un tas», il semble que nous devions accepter les trois propositions: (a ) 囹T(0); (b ) 囹T(n )囹T(n + 1); (c ) T(N) (pour un entier N suffisamment grand, par exemple N = 1010). Mais ces trois propositions sont contradictoires: en effet, de 囹T(0) et de 囹T(0)囹T(1), on tire 囹T(1), et, en répétant N fois un modus ponens de ce type, on obtient 囹T(N).

Goguen a proposé en 1969 une élégante solution de ce paradoxe. Définissons l’ensemble (flou) des tas par une application croissante 猪T : face=F0021 類[0, 1] telle que 猪T(0) = 0, et introduisons sur l’ensemble 行 des couples (n, p ) d’entiers tels que np une relation floue dont la signification intuitive sera: «si n grains ne font pas un tas, p grains non plus». Cette relation sera correctement caractérisée par la fonction 猪U : 行[0, 1] définie par: 猪U(n , p ) = 猪 size=1(p ) / 猪 size=1(n ) (on a 猪U(n , n ) = 1 et 猪U(n , p ) 麗 1 lorsque np , puisque 猪 size=1 est décroissante). 猪U(n , n + 1), très proche de 1, peut être vue comme le «degré de vérité» de l’énoncé (b ) du paradoxe. Or:

Et, si N est assez grand, ce produit peut être voisin de 0 (bien que tous les facteurs qui y figurent soient très proches de 1). En d’autres termes, et c’est là un point très original de la théorie des ensembles flous, une inférence comme (b ) peut être «presque correcte», alors que son usage répété dans une longue chaîne argumentative peut être «presque sûrement incorrect». On comparera cette solution du sorite à celle que suggère la sémantique des supervaluations: dire qu’une collection est un tas signifie qu’elle reste un tas quelle que soit la manière dont on remplace le concept usuel de tas par un concept non vague. Mais, parmi toutes ces précisions, il en existe certainement une, soit «tas 戀凉», pour laquelle l’énoncé «si n grains ne forment pas un tas 戀凉, alors n + 1 non plus» est faux pour un certain n . Par conséquent, pour cet n , l’énoncé (b ) du paradoxe est dénué de valeur de vérité.

Objet de recherches très actives, la théorie des ensembles flous possède actuellement la faveur des (systèmes) experts: elle a été employée avec succès en intelligence artificielle pour l’assistance au diagnostic médical ou la reconnaissance des formes. Elle soulève cependant de sérieuses objections épistémologiques: quelle est la signification réelle d’un énoncé comme «Paul appartient à l’ensemble des jeunes au degré 0,28»? Zadeh se défend d’introduire là une précision artificielle, et soutient que les assignations numériques de ce type ont elles-mêmes des valeurs de vérité floues . Il y a donc deux niveaux de «fuzzification»: sur le plan du langage-objet (les ensembles flous), et sur le plan métalinguistique (le prédicat «vrai» est lui-même flou). Cette suggestion, qui adosse la théorie des ensembles flous à une logique floue (fuzzy logic ), soulève autant de questions qu’elle en résout. Zadeh (1975) définit la vérité comme un ensemble flou auquel le degré de vérité 0,8 appartient au degré 0,7, le degré 0,9 au degré 0,9, et le degré 1 au degré 1. En quel sens et à quel degré cet énoncé est-il lui-même vrai?

4. Logique des impératifs

Selon R. M. Hare (1952), l’éthique se réduit à l’étude logique du langage de la morale, et débute par la description des impératifs. Mais, bien que des travaux soient fréquemment consacrés, depuis cette date, à la formalisation des discours contenant des énoncés à la forme impérative, l’existence d’une logique des impératifs conçue comme discipline autonome n’est pas véritablement attestée. C’est que la place semble déjà occupée par la logique déontique , c’est-à-dire l’étude formelle des énoncés normatifs («il est obligatoire, permis, interdit de...»), qui s’est développée depuis 1950. Une analyse plus poussée montre cependant que les énoncés au mode impératif ont un régime distinct des énoncés normatifs:

a ) Il n’existe aucun impératif «permissif» correspondant à l’expression déontique «il est permis que».

b ) «Fais A» n’a qu’une seule négation: «ne fais pas A». Par contre, «tu dois faire A» (ou «il est obligatoire que A») a une négation «interne» («tu ne dois pas faire A», qui est une interdiction) et une négation «externe» («ce n’est pas le cas que tu doives faire A», qui efface seulement l’obligation).

c ) Alors que «tu dois faire A» peut se mettre au passé, un impératif comme «fais A» n’est utilisé que pour ordonner à quelqu’un une action à accomplir après que l’énoncé a été prononcé.

d ) Beaucoup d’énoncés normatifs ne peuvent être transcrits par des ordres: par exemple les normes éthiques (sauf à adopter une conception purement théonomique de la morale).

e ) Il existe entre les deux classes d’énoncés une différence profonde, visible surtout à la première personne: «je dois faire A» n’équivaut nullement au «fais A» que le sujet s’adresse à lui-même: on peut asserter l’énoncé normatif tout en refusant pour soi-même le commandement correspondant.

Les impératifs sont donc irréductibles aux énoncés déontiques. Ces derniers sont logiquement représentés par l’application d’un opérateur déontique à la proposition qui exprime le contenu de la norme. De la même manière on séparera, dans un impératif, le contenu propositionnel (ou: le composant phrastique , Hare) et la force (ou: le composant neustique ). Par exemple, le composant phrastique de «ferme la porte» est à peu près «la porte est fermée par toi dans un avenir proche», et son composant neustique est la marque du mode impératif. «Fais A» sera symbolisé par A! (le contenu phrastique A est commun à l’énoncé impératif et à l’énoncé indicatif correspondant). Les connecteurs logiques seront traités comme des éléments du contenu phrastique de l’énoncé: donc (face=F0019 囹A)!, (A & B)!, (A 鈴 B)! seront bien formés, mais pas A! & B! ni A! 鈴 B!. C’est que l’énoncé «je vous ordonne A ou je vous ordonne B» n’est plus l’énoncé d’un ordre («je vous ordonne» a perdu sa «force» impérative).

Une des difficultés de la logique des impératifs est l’absence de toute notion de vérité: il n’y a guère de sens à dire que «ferme la porte» est vrai ou faux (le problème analogue est moins aigu en logique déontique, puisque les énoncés normatifs peuvent être également conçus comme des énoncés descriptifs: «A est obligatoire»). On associera donc aux impératifs non des conditions de vérité, mais des conditions de satisfaction (N.B.: il n’y a qu’un rapport d’homonymie avec la notion sémantique de satisfaction dans la logique usuelle). Les conditions de satisfaction d’un ordre sont les circonstances dans lesquelles l’ordre peut être considéré comme exécuté (ces circonstances sont évidemment décrites par la composante phrastique de l’ordre).

Une inférence impérative est un argument qui permet de passer d’une ou plusieurs prémisses impératives A1!, ..., An ! à une conclusion impérative B!. On ne peut certainement pas définir la validité d’une telle inférence par le fait qu’elle préserve la satisfaction. Si tel était le cas, on se ramènerait trivialement à la validité de l’inférence déductive de A1, ..., An à B. Et cette définition aurait des conséquences inacceptables: on pourrait inférer de l’ordre «mets cette lettre à la boîte» l’ordre «mets cette lettre à la boîte ou jette-la au feu». Par conséquent, selon une suggestion de A. J. Kenny, on définira au contraire l’inférence impérative de la manière suivante: d’un ordre donné, on peut inférer n’importe quel ordre dont l’exécution suffirait , si elle était réalisée, à réaliser l’exécution de l’ordre initial. Les inférences impératives procèdent alors «à l’envers» ou «en miroir» des inférences déductives auxquelles se prêtent les contenus phrastiques qu’elles mettent en jeu. L’ordre (procuration) «vote pour un gaulliste» n’entraîne pas l’ordre «vote» (car l’obéissance à ce dernier ne garantit nullement l’obéissance au premier): c’est l’inverse qui est le cas, bien que voter pour un gaulliste soit certainement voter. De plusieurs prémisses impératives, on inférera n’importe quel impératif dont l’exécution satisfait l’une des prémisses sans contredire à la satisfaction des autres. Formellement: une inférence de A1!, ..., An ! à B! sera considérée comme valide si:

a ) il existe i , 1 諒 in , tel que B 念 Ai ;

b ) l’ensembleA1, ..., Ai -1, Ai +1, ..., An , B est cohérent.

Cette définition donne au raisonnement pratique un caractère «défaisable» (defeasible ): l’ajout d’un nouvel ordre An +1! peut obliger à retirer une conclusion (l’ensemble mentionné dans la condition b peut devenir incohérent par suite de l’introduction de An +1). Ce phénomène, qui ne se produit jamais avec la logique indicative usuelle, rapproche la logique des impératifs des logiques non monotones .

5. Logique inductive

Un moyen simple de définir la logique inductive consiste à l’opposer à la logique déductive, supposée connue. Considérons par exemple les énoncés suivants: A1 («tous les gens qui habitent Paris habitent en France»), A2 («X habite Paris»), B («X habite en France»). Si l’on nomme A la conjonction de A1 et A2, il est clair que A implique B. La logique déductive a pour objet les relations de ce type. Considérons maintenant les énoncés A 1 («Paris a 4 millions d’habitants»), A 2 («Paris compte 3 millions de locataires»), B («X est locataire») et A conjonction de A 1, A2 et A 2. A n’implique pas (déductivement) B : il y a des Parisiens qui possèdent leur logement. Mais si nous savons que A , nous avons tendance à accorder une certaine crédibilité à B : l’hypothèse B est étayée ou «supportée» par l’évidence A . La logique inductive se propose de donner une formulation rigoureuse de cette idée intuitive.

Les premières tentatives pour décrire la relation entre deux propositions dont l’une soutient l’autre sans que la vérité de la première soit logiquement incompatible avec la fausseté de la seconde remontent au XVIIe siècle (Pascal, Leibniz, Bernoulli). Mais c’est seulement dans les années 1920, avec l’école de Cambridge (Johnson, Keynes, Nicod, Jeffreys) que l’on développe systématiquement l’idée séminale de la logique inductive, à savoir la conformité de cette relation de «support» aux principes mathématiques du calcul des probabilités. L’œuvre majeure dans ce domaine est cependant celle de Carnap, dont le monumental Logical Foundations of Probability (L.F.P.) date de 1950. C’est de sa version de la logique inductive qu’il sera ici question.

Le concept fondamental de Carnap est celui d’implication partielle . Il s’agit d’une implication où, en un certain sens, la conclusion H est déductivement impliquée par une «partie» de la prémisse E. Schématiquement, implication classique et implication déductive peuvent se représenter comme suit:

On notera immédiatement que la logique inductive, contrairement à la logique déductive, repose sur des notions métriques . Une hypothèse H sera dite impliquée à un certain degré par une évidence E. Ce degré, noté c (H, E), est appelé le degré de confirmation de H par E. Le problème central de la logique inductive consiste alors à définir une fonction c : face=F0021 硫 憐 硫[0, 1] qui associera à tout couple d’énoncés d’un langage 硫 (si possible assez riche pour exprimer les observations et les hypothèses scientifiques usuelles) un nombre réel non négatif mesurant le degré auquel le premier énoncé est impliqué par le second. Cette fonction devra être de préférence calculable (on aimerait, pour utiliser cette logique, qu’il existe une procédure effective fournissant la valeur de c pour la donnée de H et de E); elle devra en outre satisfaire aux lois formelles du calcul des probabilités, et répondre à un certain nombre de conditions supplémentaires d’adéquation dictées par le sens intuitif de la notion de confirmation.

Avant d’entrer dans le détail de la définition de c , il convient de signaler une similitude et une différence entre logique inductive et logique déductive.

a ) La logique inductive, comme la logique déductive, est conçue comme une discipline formelle , c’est-à-dire que ses propositions sont totalement indépendantes:

– des états de choses empiriquement réalisés – le degré de confirmation de H par E serait le même si le monde était différent de ce qu’il est; une proposition comme «c (H, E) = r » sera considérée comme tautologique si elle est vraie, et contradictoire si elle est fausse; dans les termes de Carnap, la logique inductive est une discipline analytique;

– de nos croyances subjectives – de même que la logique déductive ne se propose pas de décrire la manière dont nous raisonnons effectivement, la logique inductive n’a pas pour objectif de représenter la confiance que nous attachons personnellement à certains énoncés sur la base de certains faits. Ce dernier trait oppose la logique inductive aux théories subjectives de la probabilité proposées par des auteurs comme Ramsey, de Finetti et Savage.

b ) Il n’y a pas en logique inductive d’équivalent à la règle de modus ponens (P, P implique Q; donc Q) en vigueur dans la logique déductive: il n’est pas question de «déconditionnaliser» les hypothèses par une règle du type «E, E implique partiellement H (à un degré élevé); donc H». La raison en est simple: si élevé que soit c (H, E) 麗 1, E reste compatible avec la fausseté de H. Sur le plan des applications de la logique inductive, on ne peut énoncer la règle méthodologique «E, E confirme H au degré r ; donc on n’est justifié à croire H au degré r » qu’en l’accompagnant d’une restriction baptisée réquisit d’évidence totale :

– la règle doit mentionner l’instant t auquel le jugement de crédibilité est prononcé;

– E doit consigner la totalité de l’évidence disponible à l’instant t . En effet, si E n’implique que partiellement H, rien n’exclut l’acquisition en un instant ultérieur t d’une nouvelle évidence E telle que: c (H, EE ) difflère de c (H, E) et, en particulier, lui soit strictement inférieure (on peut toujours prendre pour E l’énoncé 囹H!). La situation est radicalement différente en logique déductive, où l’adjonction d’une nouvelle prémisse n’oblige jamais à retirer une conclusion (si Q est déductible de P, il l’est encore de tout ensemble de prémisses qui contient P). On dit que la logique déductive est monotone (intuitivement: l’ensemble des conclusions croît avec l’ensemble des prémisses), et que la logique inductive ne l’est pas.

La définition du degré de confirmation

On distingue pour l’essentiel les langages 硫n 神 (comportant 神 prédicats et n constantes d’individus) et les langages 硫 神 秊 ( 神 prédicats, une infinité d’individus). Limitons-nous d’abord aux premiers. Une description d’état est une conjonction du type:

où 﨎ij est soit le symbole vide, soit le symbole de négation: ces descriptions d’état dépeignent chacune un état possible du monde en disant, de chaque individu x j , s’il est ou non un 﨏i . Le rang R(A) d’un énoncé A est l’ensemble des descriptions d’état pour lesquelles A est vrai. On affecte à chaque description une certaine masse, de telle sorte que la masse totale soit 1. Cette répartition de masses peut évidemment s’effectuer de plusieurs manières. Elle induit sur l’algèbre de Boole de tous les rangs une mesure face=F9828 m de probabilité (on affecte à chaque rang la masse totale des descriptions qu’il contient). Lorsque chaque élément S de l’ensemble 崙 des descriptions reçoit une masse strictement positive, on parle de mesure régulière . On définit alors le degré de confirmation par c (H, E) = face=F9828 m(HE)/ face=F9828 m(E), et donc par:

La fonction (H, E)c (H, E) est appelée fonction de confirmation ou c-fonction et baptisée régulière lorsque la mesure sousjacente l’est déjà. Comme la mesure (du rang) de E est 1 lorsque E est une tautologie, on pourra identifier face=F9828 m(H) à C(H, t ), où t désigne un énoncé identiquement vrai.

Ainsi se dégage une signification précise pour la notion d’implication partielle. Dire que E implique (déductivement) H, c’est dire que H est vrai dans tous les mondes possibles où E est vrai. Dire que E implique H au degré r , c’est dire que H est vrai dans (100 r ) % des états du monde où E est vrai, ou encore qu’une proportion r du rang de E est dans celui de H (la partie de 倫(E) qui est incluse dans 倫(H) figure hachurée dans le schéma précédent). Les c -fonctions sont donc les instruments qui mesurent le soutien conféré à H par l’évidence E: elles déterminent le rapport entre le nombre d’états du monde où E et H valent tous deux, et le nombre d’états où E est valable.

Puisqu’il subsiste une grande latitude dans la manière de pondérer régulièrement les descriptions d’état (on peut procéder d’une infinité de façons distinctes), on peut chercher à définir des conditions supplémentaires d’adéquation pour les c -fonctions. L’idéal serait de pouvoir définir la c -fonction qui codifierait nos habitudes inductives. Parmi ces conditions supplémentaires, citons:

a ) La symétrie . Les c -fonctions symétriques sont celles dont les valeurs restent inchangées lorsqu’on permute les constantes d’individus. En un sens, l’exigence de symétrie est une expression du principe d’indifférence , selon lequel nous devons traiter de manière équivalente des objets dont nous n’avons pas de raison de penser qu’ils diffèrent. Par exemple, la valeur de c (H, E) devrait être égale à celle de c (H, E ) si H est l’hypothèse universelle 葉x ( 﨏x 念 祥x ) et si E et E désignent les évidences respectives 﨏a & 祥a et 﨏b & 祥b . Se limiter aux c -fonctions symétriques revient à tenir pour substituables les uns aux autres les noms d’individus dans 硫n size=1.

b ) L’ajustement . La définition d’une c -fonction pour un langage 硫 神 秊, qui comporte une infinité d’individus, soulève un certain nombre de difficultés que nous n’examinerons pas (par exemple, les descriptions d’état deviennent infinies, et ne sont donc plus des formules du langage). Reste que l’exigence d’une telle définition induit des contraintes sur les c -fonctions relatives aux langages du type 硫n size=1. En effet, une c -fonction c size=1 relative à size=1 size=1 秊 sera définie comme la limite d’une suite (c n )n size=1 N de c -fonctions définies sur 硫n size=1: c size=1(H, E) = limc n (H, E). Encore n size=1 size=1

faut-il que les c -fonctions considérées se «prolongent» les unes les autres. En effet, un énoncé quantifié, comme 葉xx , change de conditions de vérité lorsqu’on passe de 硫n size=1 à 硫 神n +1 (il ne signifie plus 炙 﨏x i , mais 1 諒 in 炙﨏x i ); par contre, les énoncés non 1 諒 in +1quantifiés gardent la même signification. On demandera donc que c n et c n +1 soient ajustés , c’est-à-dire qu’ils attribuent la même valeur à tout couple d’énoncés non quantifiés. C’est encore une restriction sur le choix des c -fonctions: c n étant donnée, certains choix de c n+1 seront interdits.

c ) L’adéquation à l’apprentissage par l’expérience . Il s’agit ici de définir les conditions auxquelles devraient satisfaire les c -fonctions pour représenter fidèlement les procédures d’apprentissage inductif. Quelques définitions sont nécessaires à leur formulation. Appelons Q-prédicat tout prédicat de la forme 炙﨎ii , où 﨎i est le symbole 1 諒 i 諒 神vide ou la négation (il y a donc q = 2 神 Q-prédicats dans un langage 硫 神). Il est clair qu’au moins un individu satisfait à un Q-prédicat donné, et que deux individus qui satisferaient à un même Q-prédicat seraient indiscernables dans 硫 神: les Q-prédicats sont, au fond, l’analogue des infimae species aristotéliciennes, c’est-à-dire de ces espèces qu’il est impossible de diviser logiquement à nouveau. Tous les prédicats 祥 définissables dans 硫 神 pourront s’écrire normalement sous forme d’une disjonction de Q-prédicats, par une équivalence du type 祥x 沈 鈴Qi x . 1 諒 ill size=1 (resp. l size=1/q ) est appelé l’étendue logique absolue (resp. relative ) de 祥. On peut maintenant formuler les principes:

Condition de pertinence («relevance») des cas particuliers . Le degré de confirmation doit s’accroître lorsqu’un cas particulier vient s’ajouter à l’ancienne évidence: pour chaque Q-prédicat Qk , c (Qk x i , E & Qk x j ) 礪 c (Qk x i , E) lorsque x i et x j ne figurent pas dans E.

Condition de suffisance . Lorsqu’on cherche à déterminer la part de l’expérience qui est pertinente pour évaluer Qk x i , il suffit de s’en tenir à l’évidence qui concerne les cas particuliers de Qk . En d’autres termes, si E s’obtient simplement à partir de E en remplaçant les occurrences d’un Q-prédicat Qp par celles d’un Q-prédicat Qp size=1 (avec p et p différents de k ), on doit avoir:

Le continuum des méthodes inductives

Existe-t-il des c -fonctions qui répondent à ces conditions d’adéquation, et, si oui, combien y en a-t-il? Une réponse à cette question est fournie par un théorème fondamental de la logique inductive, qui énonce que les valeurs de toute c -fonction symétrique satisfaisant aux conditions c peuvent être écrites sous une certaine forme normale, dépendant d’un paramètre. Soit, en effet, 祥 un prédicat, et E une évidence de la forme 炙Qi j x j 1 諒 js (c’est-à-dire une conjonction de s énoncés du type «le j -ième individu examiné satisfait le prédicat Qi j »), où la constante a ne figure pas. Si s size=1 est le nombre des Q-prédicats qui, à la fois, figurent parmi Qi 1, ..., Qi S et figurent dans l’écriture normale de 祥, on montre que:

expression dans laquelle est un paramètre qui peut prendre toutes les valeurs réelles strictement positives. Il subsiste donc une infinité non dénombrable de c -fonctions adéquates, qui forment une famille (c size=1)0 size=1 size=1 size=1 size=1, appelée le continuum des méthodes inductives .

Quelques commentaires sur le théorème fondamental sont nécessaires. Le numérateur de l’expression est:

On a observé s individus. 祥 s’écrit sous forme d’une disjonction qui contient, entre autres, les s size=1 Q-prédicats mentionnés, qui sont vérifiés par s size=1 de ces individus observés. Ces derniers satisfont donc 祥, et ce sont les seuls individus observés à être dans ce cas, puisque aucun individu ne peut satisfaire deux Q-prédicats distincts. La fraction s size=1/s exprime donc la fréquence des 祥 dans l’échantillon observé. Cela a une signification épistémologique importante. Carnap lui-même considérait qu’il y avait deux concepts distincts de la probabilité: la probabilité logique (le degré de confirmation), la probabilité statistique (définie comme la limite d’une fréquence relative dans une suite infinie d’épreuves d’un certain type). Mais, bien que la version carnapienne de la logique inductive ait évidemment été conçue pour formaliser le premier aspect de la notion de probabilité, ses théorèmes sont parfaitement compatibles avec le point de vue statistique traditionnel. Supposons en effet que les différentes issues possibles d’une épreuve puissent être décrites par une famille Q1, ..., Qp de Q-prédicats. Une évidence statistique Es de taille s relative à cette épreuve pourra toujours être consignée sous la forme d’une conjonction de s formules du type Qi j x j («le résultat de la j -ième épreuve a été Qi j »). Désignons par f k (s )/s la fréquence relative de l’issue Qk dans une épreuve de longueur s , et examinons le degré auquel E confirme Qk x s +1. D’après le théorème fondamental, ce degré, lorsque s s’accroît indéfiniment, est limc (Qk x s+1 , Es ). s size=1 size=1

Mais pour s tendant vers l’infini, les termes en deviennent négligeables. Donc, si f k (s )/s converge vers une limite Fk (qui est justement ce que le théoricien classique appelle la probabilité de Qk ), ce degré de confirmation est limf k (s )/s = Fk .

s size=1 size=1

On conçoit ainsi à quel titre la fréquence observable intervient dans la formation du degré de confirmation. Cette fréquence est une donnée a posteriori, c’est-à-dire une information qui émane de l’évidence obtenue. Par contre, l’étendue logique (relative) de 祥, soit l size=1/q , qui intervient aussi dans (), est une donnée a priori, c’est-à-dire une information que l’on possède avant même l’évidence et indépendamment de toute expérience: l’étendue logique n’est pas une notion factuelle. Ainsi, le prédicat «petit ou vert» est plus étendu que le prédicat «petit», indépendamment du point de savoir s’il y a des individus petits qui ne sont pas verts (cette dernière question, elle, est empirique). L’étendue des tautologies est 1, celle des contradictions est 0, et celle des 神-prédicats primitifs de 硫 size=1 est 1/2. On conçoit que la fréquence et l’étendue logique relatives de 祥 interviennent concurremment dans la détermination de c ( 祥a , E). L’étude du terme () montre quelle y est leur part respective. La fréquence observée y intervient avec le poids s (plus l’évidence statistique est vaste, plus ses résultats ont de valeur), et l’étendue logique avec le poids. Si est négligeable par rapport à s , c ( 祥a , E) est à peu près égal à la fréquence des réalisations de 祥 dans l’échantillon observé; si s est négligeable par rapport à, c ( 祥a , E) s’identifie à peu près à l’étendue logique de 祥, laquelle ne dépend pas de E. La valeur de reflète donc le poids respectif que l’on est disposé à attribuer aux données factuelles et aux facteurs logico-linguistiques.

Considérons les cas limites = 0 et = 秊, qui n’appartiennent plus au continuum des méthodes inductives. Si = 0, seule la fréquence observée est prise en compte pour déterminer le degré de confirmation, si faible soit la taille de l’évidence statistique. La fonction c 0, qui ne permet donc pas d’assigner une probabilité à une hypothèse en cas d’évidence nulle, a des aspects paradoxaux. Adopter c 0, c’est considérer que les individus observés, si peu nombreux soient-ils, sont parfaitement représentatifs de ceux qui ne l’ont pas été. En particulier c ( 祥a , 祥b ) = 1 (même si 祥b n’implique pas 祥a !). Le choix de = 0 se heurte d’ailleurs à tous les arguments intuitifs qui tendent à montrer la nécessité d’une information a priori dans les assignations de probabilités. (Imaginons par exemple que deux individus prétendent l’un qu’il est en mesure de reconnaître, dès les premières mesures d’un morceau de musique, s’il s’agit d’un madrigal de Schütz, l’autre qu’il peut prédire, dès que le croupier a lâché la boule, le numéro qui va sortir. Même si 9 sur 10 des expériences tentées dans les deux cas ont été concluantes, nous hésiterions certainement à considérer que les deux prétentions ont été confirmées au même degré.) Le choix de c 0 (que Carnap nomme la «règle droite») est donc intenable.

D’un autre côté, le choix de = 秊, qui revient à déterminer le degré de confirmation sur la seule base de considérations logiques , est inacceptable pour des raisons symétriques: n’accordant aucun poids à l’information a posteriori, il est la négation même du principe selon lequel l’expérience peut nous apprendre quelque chose (rétrospectivement, on peut interpréter en faveur de la suggestion = 秊 la proposition 5.15 du Tractatus logico-philosophicus de Wittgenstein).

Quelle c -fonction choisir dans le continuum lui-même? Dans Logical Foundations of Probability , Carnap préconisait le choix d’une c -fonction notée c – en fait équivalente à c q . Mais les arguments en faveur de c sont plutôt des arguments de simplicité logique (si = q , le degré de confirmation se définit de manière remarquablement aisée). Pour le reste, il faut avouer qu’on ne connaît pas aujourd’hui de condition naturelle supplémentaire qui imposerait un choix et un seul pour (et donc pour c ). Et comme, pour des raisons bien compréhensibles, le choix d’une méthode inductive ne saurait lui-même reposer sur des arguments inductifs, on doit peut-être se résigner à voir dans la valeur de un élément irrémédiablement subjectif et personnel, la mesure de l’«inertie inductive» de chacun de nous, c’est-à-dire de l’intensité de notre répugnance à changer nos idées à la lumière de l’expérience.

L’héritage de Carnap

Mentionnons pour conclure certaines difficultés très souvent évoquées dans les débats contemporains autour de la logique inductive.

La confirmation des hypothèses universelles

Les langages 硫 size=1 pour lesquels on définit communément un degré de confirmation sont notoirement insuffisants pour formaliser la pratique inductive réellement en usage dans les sciences: dans un langage du premier ordre ne comportant qu’un nombre fini de prédicats monadiques , on peut exprimer l’hypothèse que 50 individus sont verts et 50 autres jaunes, mais pas l’hypothèse que 50 individus successifs sont alternativement verts et jaunes. Or, même à l’intérieur d’un langage aussi pauvre que 硫 神 秊, il paraît difficile de soutenir que les c -fonctions reflètent vraiment le soutien conféré aux théories scientifiques usuelles par les expériences de laboratoire. La difficulté la plus visible tient à ce que, dans 硫 神 秊, toutes les c -fonctions attribuent un degré nul à la confirmation d’une hypothèse universelle (une « loi ») par une évidence finie: on attendrait au contraire que, si la loi est vraie, ce degré tende vers 1 lorsque des individus sans cesse plus nombreux sont examinés.

Carnap maintenait qu’il n’y avait là nul problème réel, puisque la question de la confirmation d’une hypothèse universelle 葉xx , convenablement comprise, se ramenait, selon lui, à la question de la confirmation de l’hypothèse (non universelle) selon laquelle le prochain individu observé serait encore un 﨏: les lois scientifiques ne seraient donc que des procédés linguistiques particulièrement commodes, mais non indispensables, pour exprimer des prédictions portant sur des événements singuliers. Cette dernière affirmation a, si l’on ose dire, confirmé les épistémologues anti-inductivistes, Popper au premier chef, dans l’idée que le projet de Carnap tout entier repose sur une conception erronée des théories scientifiques (cf. Lakatos, 1968).

Notons cependant que Hintikka (1964, 1966) a montré la possibilité d’un système de logique inductive où le degré de confirmation des énoncés universels n’est pas nul. Ce système (dont le système de Carnap est un cas limite) repose sur l’attribution d’une masse identique à chaque description de structure (une description de structure est définie comme une disjonction de descriptions d’état isomorphes, pouvant être obtenues les unes à partir des autres par permutation des noms d’individus). La logique inductive de Hintikka s’étend sans peine au cas où des prédicats polyadiques (c’est-à-dire des relations) figurent dans le langage. Naturellement, dans cette extension (qui est tout à fait nécessaire pour entreprendre une «reconstruction rationnelle» de la démarche scientifique), les fonctions de confirmation ne sont plus effectivement calculables, puisque la logique déductive des prédicats polyadiques du premier ordre ne l’est déjà plus.

Les paradoxes de la logique inductive

On connaît, pour la logique inductive, plusieurs paradoxes analogues aux antinomies bien connues de la logique déductive (Menteur, antinomie de Russell, etc.). On se contentera ici de mentionner les plus discutés.

Le paradoxe des corbeaux (Hempel, 1945)

Une évidence qui confirme une hypothèse doit aussi en confirmer les conséquences logiques (principe de «conséquence spéciale»). Donc l’évidence d’une socquette rose, qui soutient l’hypothèse H selon laquelle tous les objets non noirs sont des non-corbeaux, confirme également l’hypothèse H qui lui est logiquement équivalente, et selon laquelle tous les corbeaux sont noirs. Mais il semble bien que cette possibilité de pratiquer l’ornithologie à l’abri des intempéries doive être exclue.

Le paradoxe de Goodman (1953)

Supposons que toutes les émeraudes examinées avant l’instant t soient vertes et introduisons le nouveau prédicat «vreu», défini par «x est vreu exactement si x est observé avant t et il est vert, ou bien x n’est pas observé avant t et il est bleu». L’évidence obtenue en t confirme de la même façon l’hypothèse H selon laquelle toutes les émeraudes sont vertes et l’hypothèse H selon laquelle toutes les émeraudes sont vreues. En d’autres termes, cette évidence confirme, à propos des émeraudes qui pourront être examinées postérieurement à l’instant t , à la fois l’hypothèse qu’elles seront vertes et l’hypothèse qu’elles seront bleues.

Le paradoxe de la loterie (Kyburg, 1961)

Il s’agit d’un paradoxe qui concerne moins la notion de confirmation que celle d’acceptabilité : il montre qu’il est toujours possible de construire un système d’hypothèses acceptables, c’est-à-dire «pratiquement certaines», dont la conjonction soit contradictoire. Admettons en effet qu’une hypothèse soit tenue pour acceptable si elle est confirmée à un degré au moins égal à 1 漣 﨎 = (n 漣 1)/n (pour n arbitrairement grand) par l’évidence disponible. Rapportée à une loterie de n billets dont un seul est gagnant, chaque hypothèse Hi («le i -ième billet est perdant») devrait être acceptée. Or leur conjonction 炙H, contradictoire 1 size=1 i size=1 n

avec l’information qu’il y a un billet gagnant, est elle-même inacceptable.

6. Logique des interrogatifs

La logique des interrogatifs, ou logique érotétique ( 兀 﨎福諸精兀靖晴﨟: la question) a pour objet la description formelle des énoncés interrogatifs et, subsidiairement, l’étude des relations entre questions et réponses. Bien que l’article prémonitoire de F. S. Cohen (1929) donne déjà certains éléments d’un traitement logique du problème, l’essor spectaculaire de la discipline est beaucoup plus récent: on peut, pour l’essentiel, mentionner les travaux de L. Åqvist et de N. D. Belnap à partir du début des années 1960.

Les questions peuvent être sommairement réparties en deux classes. Les questions propositionnelles (ou questions de décision ), du type «est-ce que Napoléon a gagné la bataille de Iéna?», appellent une réponse par oui ou par non. Les questions catégorielles , du type «qui a gagné la bataille de Iéna?, présentent sur le mode interrogatif une certaine fonction propositionnelle («x a gagné la bataille de Iéna»), nommée la matrice de la question, et appellent la donnée de la constante («Napoléon») qui satisfait cette fonction. La question présuppose l’existence d’au moins un individu satisfaisant à la matrice. Lorsque la matrice est satisfaite par plusieurs individus, la question peut appeler, selon le cas et en fonction de considérations contextuelles, la donnée d’un seul de ces individus ou de tous. Si la matrice d’une question est 﨏x , l’énoncé 﨏a est appelé la requête de la question, à la condition qu’il soit vrai et que a soit connu du questionneur.

S’agissant des questions catégorielles, on avait remarqué très tôt (F. S. Cohen, Carnap) que l’opérateur d’interrogation avait un rôle assez semblable à celui d’un quantificateur: tous deux transforment une fonction propositionnelle, donc une phrase «ouverte», en phrase «complète». On tendait donc à identifier une question à l’ensemble de ses réponses (un énoncé universellement quantifié est la conjonction de ses cas particuliers). Cette approche est grossièrement réductrice. Elle ne tient compte ni de l’aspect injonctif du questionnement, ni de sa finalité, qui est ordinairement de compléter le savoir du questionneur. L’apparition des logiques déontique et épistémique au début des années 1960 a permis des analyses plus subtiles.

Ainsi, Åqvist propose de construire la logique érotétique sur la base d’une logique «impérative-épistémique» issue des travaux de Hintikka. Selon lui, un interrogatif est un impératif dont l’objet est un état de savoir: demander «qui habite ici?», c’est ordonner à son interlocuteur: «fais en sorte que je sache qui habite ici?». Formellement, le langage 硫 de la logique érotétique sera donc celui de la logique quantificative du premier ordre, étendu par les opérateurs épistémiques (Kp signifie «je sais que p ») et par un opérateur impératif ! (A! signifie «fais A»). On définit un opérateur interrogatif n -aire ?n , par:

L’opérateur des questions propositionnelles avec réponse par oui ou par non en est un cas particulier. C’est ?, défini par:

Il y aura plusieurs opérateurs pour les questions catégorielles, distingués par la nature de la réponse qu’ils requièrent: ? exige la donnée d’au moins un individu satisfaisant la matrice, ?†† demande qu’on les indique tous, et ?††† requiert qu’on indique l’unique individu qui la satisfait (l’unicité est donc présupposée).

Les définitions et les usages de ces divers opérateurs ressortent du tableau suivant (les lettres V et R désignent les propositions «tu as une voiture», «tu as repeint ta voiture», et C le prédicat «être classé, et participer au tournoi considéré»).

On notera qu’une question catégorielle comme la question 4 peut avoir plusieurs lectures. 4 a est la version existentielle; elle présuppose la satisfaction de C, mais n’attend qu’une réponse «échantillonnaire» («a est classé»). 4 b est la version universelle, qui attend la liste de tous les joueurs classés. 4 b, qui n’est donc pas la seule possible, est la plus naturelle: elle maximise l’information espérée.

7. Logique modale

D’une proposition, on peut chercher à savoir si elle est vraie ou fausse. Mais on peut en outre vouloir déterminer sa manière d’être vraie, si elle l’est. Est-elle vraie en vertu de sa forme, comme c’est le cas avec «P implique P» (quel que soit l’énoncé que l’on met à la place de X dans la forme propositionnelle «X implique X», la proposition résultante est vraie). Ou l’est-elle en vertu d’un fait, comme c’est le cas avec «il pleut sur Cadiz le 26 janvier 1987»? Cette opposition entre vérité formelle et vérité factuelle est un moyen parmi d’autres de discriminer, au sein des propositions vraies, entre celles qui peuvent être fausses et celles qui ne le peuvent pas: on peut concevoir un monde dans lequel il ne pleuvait pas là-bas ce jour-là, mais non un monde où P est le cas sans que P soit le cas. Une proposition comme «PP» sera dite nécessairement vraie ou, plus brièvement, nécessaire . De la même manière une proposition qui ne peut pas être vraie sera dite impossible , une proposition ni nécessaire ni impossible sera appelée contingente (certaines propositions contingentes seront vraies, d’autres fausses), et une proposition non impossible sera dite possible . Nécessité, impossibilité, contingence et possibilité sont autant de modalités (de la vérité) des propositions. Ces quatre modalités s’articulent donc suivant le schéma ci-dessous.

On notera 撚 P et 﨤P l’attribution à la proposition P des modalités respectives de la nécessité et de la possibilité. Bien entendu, 撚 P et 﨤P sont à leur tour des propositions (par exemple 撚 P se lira «il est nécessaire que P» ou «nécessairement P»). Les modalités de contingence et d’impossibilité étant visiblement définissables en termes des autres modalités («il est impossible que P» équivaut à «il est nécessaire que non P» et «il est contingent que P» équivaut à «il est possible que P et il est possible que non P»), aucun symbole spécial ne sera introduit pour les désigner. Par ailleurs, les modalités 﨤 et 撚 sont elles-mêmes interdéfinissables ( 﨤P 沈 囹 撚 囹P et 撚 P 沈 囹 﨤 囹P), de sorte que l’on peut toujours se ramener à une seule modalité (en général la nécessité), et que l’existence de deux symboles modaux 﨤 et 撚 est simplement destinée à accroître la lisibilité des formules.

Ces modalités peuvent être conçues comme des opérateurs (unaires) qui, appliqués à des propositions, donnent d’autres propositions. Ils diffèrent toutefois des opérateurs logiques usuels (négation 囹, conjonction &, disjonction 鈴, implication 轢, équivalence 沈) sur un point essentiel. Les opérateurs usuels sont vérifonctionnels , c’est-à-dire que la valeur de vérité d’une proposition formée à l’aide de l’un d’entre eux ne dépend que de la valeur de vérité de ses constituants immédiats (par exemple: la valeur de P & Q est le vrai lorsque P et Q sont vrais, et le faux, sinon). De leur côté, les opérateurs modaux, en vertu même de leur signification intuitive, ne sont pas vérifonctionnels: la connaissance de la valeur de vérité de P ne suffit pas à déterminer celle de 撚 P. Par conséquent, les opérateurs modaux ne peuvent pas être eux-mêmes définis à l’aide des opérateurs vérifonctionnels ordinaires. La logique modale constitue donc une extension non triviale de la logique usuelle.

Il importe toutefois de préciser que les définitions précédentes ne s’appliqueraient pas sans retouches à la logique modale traditionnelle développée par Aristote et ses successeurs:

a ) La définition actuelle de la possibilité a été assez longue à mettre en place. Les textes aristotéliciens, souvent énigmatiques et d’interprétation ardue, paraissent hésiter entre le possible «unilatéral», opposé seulement, comme ci-dessus, à l’impossible, et le possible «bilatéral», opposé à l’impossible et au nécessaire, et donc identifié au contingent défini plus haut.

b ) Dans la tradition aristotélicienne, la logique modale est inséparable d’une ontologie. La distinction entre nécessité et contingence y reflète l’existence de deux types de prédication singulière, les prédicats attribués à une substance pouvant être avec elle dans une relation essentielle («Socrate est humain») ou dans une relation accidentelle («Socrate est assis»). Dès lors, on peut être conduit à une interprétation différente des modalités, qui en fait non plus des opérateurs propositionnels , mais des opérateurs qui modifient les prédicats (on ne dira plus «il est nécessaire que Socrate soit humain», mais «Socrate est nécessairement humain»). Les modalités cessent alors d’être des modalités de dicto (qui déterminent la nature du dictum , de la proposition qui est dite), mais des modalités de re (qui se rapportent à la nature de la chose dont on parle). La différence, abstraction faite de ses implications métaphysiques, est logiquement significative: par exemple, une proposition comme 撚 﨏a est une proposition complexe si elle est lue de dicto (son opérateur principal est 撚 ), mais une proposition atomique si elle est lue de re . Cette distinction médiévale (Abélard, saint Thomas) est, du reste, au centre des controverses récentes sur la logique modale.

Sous sa forme moderne, la logique modale est née au début du XXe siècle des écrits de C. I. Lewis (Frege, à qui on doit indiscutablement la renaissance de la logique usuelle à l’époque moderne, estimait pour sa part que les notions de possibilité et de nécessité faisaient irrémédiablement référence à la connaissance humaine, et que leur place n’était pas en logique, mais en psychologie). En 1918, Lewis mit au point une «logique de l’implication stricte», destinée à faire pièce à deux aspects de l’implication usuelle qu’il jugeait paradoxaux: une proposition, du seul fait qu’elle est fausse, implique n’importe quelle autre proposition (ex falso quodlibet ), une proposition, du seul fait qu’elle est vraie, est impliquée par n’importe quelle proposition (ex quodlibet verum ). Il estimait que l’expression «Q découle de P», telle que nous la comprenons intuitivement, comporte une composante intensionnelle, c’est-à-dire suppose une connexion de signification entre P et Q (on pensera aux langues ordinaires, où la vérité de la phrase «X, parce que Y» dépend manifestement d’autre chose que des valeurs de vérité de X et de Y). L’implication stricte «P 蓼 Q» proposée par Lewis est en fait un opérateur modal binaire, interdéfinissable avec l’opérateur de nécessité: «P 蓼 Q» équivaut à « 撚 (PQ)» et « 撚 P» à « 囹P 蓼 P». L’étude de l’implication stricte conduisit entre 1918 et 1932 à la construction de cinq systèmes distincts S1-S5 de logique modale, aujourd’hui encore fondamentaux. Les «paradoxes» de l’implication usuelle s’y retrouvent malheureusement sous une autre forme, puisqu’on peut y dériver « 囹 﨤P(P 蓼 Q)» et « 撚 Q(P 蓼 Q)» («une proposition impossible implique strictement chaque proposition» et «une proposition nécessaire est strictement impliquée par chaque proposition»). Mais Lewis estimait qu’il s’agissait là d’une «conséquence inévitable des principes logiques d’usage quotidien»...

Les systèmes de logique modale

Étant donné la signification intuitive des modalités, on peut attendre d’un système de logique modale:

a ) Que de 撚 P on puisse déduire P. Ou, de manière équivalente, que de P on puisse déduire 﨤P (ab oportere ad esse, ab esse ad posse valet consequentia ).

b ) Que de P on ne puisse pas déduire 撚 P. Ou, de manière équivalente, que de 﨤P on ne puisse pas déduire P (ab esse ad oportere, ab posse ad esse non valet consequentia ).

c ) Que les propositions logiquement vraies soient reconnues comme nécessaires: les thèses de la logique sont un exemple particulièrement typique des propositions que nous qualifierions de nécessaires. En d’autres termes, si P est un théorème, 撚 P doit aussi en être un.

d ) Que tout ce qui se déduit d’une proposition nécessaire soit encore nécessaire (la déduction logique doit transférer aux conclusions toute la force des prémisses).

Ces conditions d’adéquation posées, il reste encore une grande latitude de choix (par exemple on n’a pas précisé si les propositions nécessaires devaient être conçues comme nécessairement nécessaires, c’est-à-dire si le fait qu’une proposition est nécessaire devait être lui-même compris comme une nécessité).

Le système le plus faible qui les remplit toutes est le système T, conçu en 1937 par R. Feys (on dira qu’un système est plus faible qu’un autre lorsque tout ce qui se démontre dans le premier se démontre dans le second, mais non pas réciproquement). Le langage de T est celui du calcul propositionnel, élargi par la règle de formation «si P est une formule, 撚 P aussi». (On notera que la définition abréviative de 﨤 et les règles de formation ainsi étendues permettent d’engendrer des formules – au sens propositionnel – précédées d’un assemblage arbitrairement long de symboles 撚 , 﨤 et 囹. Ces concaténations, qui sont la contrepartie formelle des modalités , seront appelées du même nom. Par abus de langage, l’assemblage vide sera lui aussi considéré comme une modalité, parfois notée par un point.) Les axiomes du système T sont ceux de la logique propositionnelle, auxquels on ajoute les deux énoncés « 撚 PP» et « 撚 (PQ)(face=F0019 撚 P撚 Q)». Ses règles d’inférence sont les mêmes, augmentées de la règle de nécessitation «si 塞TX, alors 塞T 撚 X» («si X est un théorème de T, 撚 X aussi»). (On ne confondra pas la règle de nécessitation avec la formule «P撚 P», qui appartient au langage de T mais qui n’est – fort heureusement! – pas un théorème.)

Le système S4 de Lewis s’obtient en ajoutant l’axiome « 撚 P撚 撚 P» au système T (historiquement, c’est l’inverse: Feys a construit le système T en écartant l’axiome en question de [la version gödelienne de] S4). Cet axiome permet de considérer les modalités 撚 et 撚 撚 comme équivalentes (l’implication converse « 撚 撚 P撚 P» est déjà un théorème de T). Alors que T contient une infinité de modalités inéquivalentes, il n’en subsiste dans S4 que quatorze: ., 撚 , 﨤, 﨤 撚 , 撚 﨤, 撚 﨤 撚 , 﨤 撚 﨤 et leurs négations. Les relations des sept modalités affirmatives sont données par le diagramme suivant (où les flèches sont des implications).

Le système S5 s’obtient quant à lui par l’ajout au système T de l’axiome « 﨤P撚 﨤P». S5 est plus fort que S4, et les modalités irréductibles y sont encore moins nombreuses. En fait, une formule commençant par une suite quelconque d’opérateurs modaux y équivaut à la formule obtenue en les effaçant tous sauf le dernier. Ne subsistent donc que 﨤, 撚 et leurs négations.

Le dernier des grands systèmes modaux est le système B («brouwérien»). Introduit en 1930 par O. Becker, il résulte de l’ajout à T de l’axiome «P撚 﨤P» («tout ce qui est est nécessairement possible»). Incomparable à S4, B est plus fort que T mais comporte, lui aussi, une infinité de modalités inéquivalentes.

On peut donc dresser la carte des principaux systèmes de logique modale (la flèche désigne cette fois-ci la relation «est moins fort que»).

Il faut noter le rôle historique joué dans l’élaboration et la mise en œuvre de ces systèmes par un bref article (une page!) de 1933, où Gödel montre que le calcul propositionnel intuitionniste peut être interprété dans S4:

– Gödel y interprète l’opérateur modal 撚 comme un prédicat de «prouvabilité». Cette lecture des opérateurs modaux en termes métamathématiques a ouvert un domaine de recherches encore très actif aujourd’hui (cf. Smorinsky, 1985).

– C’est le premier écrit où la logique modale est construite comme une extension de la logique usuelle; point de vue tout à fait opposé à celui de Lewis qui, philosophiquement et techniquement, voyait la logique modale comme une logique rivale (face=F0019 蓼 versus 轢).

– L’interprétation de Gödel montre que la construction d’une sémantique pour la logique intuitionniste et pour la logique modale sont deux problèmes équivalents (bien que la logique modale soit elle-même une extension de la logique classique!). Cette idée a été brillamment développée par Kripke (1965).

La sémantique des logiques modales

Jusqu’aux années 1960, la logique modale était restée affaire de calculs syntaxiques. L’obstacle à une approche sémantique résidait dans l’absence de vérifonctionnalité des opérateurs modaux: il semblait impossible de définir, comme à l’accoutumée, une notion inductive de valuation (où les conditions de vérité des énoncés complexes sont caractérisées récursivement à partir des conditions de vérité de leurs constituants immédiats). Il existait certes, depuis Leibniz, une tradition vivace qui assimilait les modalités à des quantifications sur les «mondes possibles» (universelle pour 撚 , existentielle pour 﨤): dire que 﨤P est vrai, c’est dire qu’il y a un monde possible où P est réalisé. Mais cette façon d’«extensionnaliser» la sémantique des opérateurs modaux en relativisant les valuations à divers mondes possibles manque de généralité. Applicable aux modalités élémentaires 撚 et 﨤 auxquelles la tradition aristotélicienne s’était confinée, elle ne permet pas à elle seule de donner une interprétation aux modalités irréductiblement complexes d’un système comme T ou S4. Supposons, en effet, que nous cherchions une interprétation qui satisfasse 﨤﨤P, mais pas 﨤P. Le procédé en question nous suggère que 﨤﨤P est vrai dans le monde w s’il existe un monde w où 﨤P est vrai. Or 﨤P est vrai en w s’il existe un monde w où P est vrai. Mais si tel est le cas 﨤P est également vrai en w , ce qu’il fallait éviter. L’idée décisive de Kripke – à vrai dire anticipée en quelque façon par des logiciens comme J. Hintikka, S. Kanger ou A. Prior – consiste à introduire entre les mondes possibles des lignes de démarcation (éventuellement franchissables dans un seul sens), en sorte que les propositions réalisées dans un monde w ne soient considérées comme possibles dans le monde w que si w est accessible à partir de w .

Formellement, une interprétation d’un système propositionnel de logique modale sera donc la donnée d’un triplet (W, face=F0021 倫, v), où W est un ensemble non vide de mondes possibles (ou, plus prosaïquement, de «points»), face=F0021 倫 une relation binaire sur W, dite d’accessibilité (ou encore de «visibilité»), et v une valuation attachant une valeur de vérité à chaque couple formé d’un monde possible et d’une formule du système en respectant les règles suivantes:

On dira qu’une formule M de la logique modale est vraie dans l’interprétation (W, face=F0021 倫, v) si v(w , M) = V pour tout w 捻 W. En raison de la multiplicité des systèmes de logique modale, le concept pertinent de validité n’est pas le concept usuel (la vérité dans toutes les interprétations), mais plutôt la vérité dans toute interprétation d’un type approprié. On peut en effet classer les interprétations (W, face=F0021 倫, v) selon la nature de la relation 倫 d’accessibilité:

a ) La classe des interprétations réflexives caractérise le système T. En d’autres termes, M est un théorème de T exactement si M est vraie dans toute interprétation (W, face=F0021 倫, v) dans laquelle ww pour tout w 捻 W. Il est facile de voir que la validité de l’axiome 撚 PP découle de la réflexivité de 倫: si 撚 P est vrai en w , P est vrai dans tous les w accessibles à partir de w , et notamment dans w , puisque w est accessible à lui-même.

b ) Les interprétations réflexives et transitives caractérisent S4. L’ajout de la transitivité de 倫 correspond en effet à l’ajout de l’axiome 撚 P撚 撚 P: si 撚 撚 P était faux en w , il existerait un w accessible à w où 撚 P serait faux, et donc de nouveau un w accessible à w où P serait faux. Mais si 倫 est transitive, w est lui-même accessible à w , et doit donc vérifier P pour que 撚 P soit vrai en w ...

c ) Le système B est caractérisé par les interprétations symétriques et réflexives . On montrerait de la même manière que la symétrie répond à l’axiome P撚 﨤P.

d ) Enfin les interprétations réflexives , symétriques et transitives conviennent à S5. La relation 倫 pertinente pour S5 est donc une relation d’équivalence, qui partage W en classes de mondes identiques au regard de l’accessibilité. Autant dire qu’à l’intérieur de l’une quelconque de ces classes la relation 倫 n’a plus de signification, et que l’on retrouve avec S5 une sémantique leibnizienne à l’état pur.

Modalité et quantification

La construction de systèmes modaux s’étend sans difficulté à la logique du premier ordre (les versions quantificatives de T, S4, B et S5 seront notées T, S4, B et S5). Mais la sémantique de ces systèmes y pose des problèmes inédits: la relation entre quantification et modalité est subtile. Si l’intuition disqualifie immédiatement des énoncés comme 葉x 﨤﨏x﨤 葉xx ou 撚 說xxx 撚 﨏x (on prendra pour 﨏 le prédicat «gagner au loto» ...), elle laisse désemparé devant une formule comme:

signalée en 1946 par R.C. Barcan-Marcus. Cette formule autorise la conversion des modalités de re en modalités de dicto (une occurrence d’opérateur modal sera dite de re si elle figure dans l’étendue d’un quatificateur, et de dicto sinon; on ne discutera pas ici jusqu’à quel point cette définition coïncide avec la notion scolastique). Interprétée en termes de mondes possibles, (BF) dit à peu près que si toute chose (actuellement réalisée) est un 﨏 dans tout monde possible, alors dans tout monde possible toute chose est un 﨏. Mais quel type de différence sommes-nous disposés à admettre entre un monde possible et le monde actuel? Si l’on considère que les seuls individus possibles sont ceux du monde actuel, éventuellement dotés de propriétés différentes, on devrait adopter (BF): car les deux « 葉» de la formule sont alors censés porter sur le même domaine d’individus. Par contre, si l’on considère qu’un monde possible peut comporter aussi des individus qui n’existent pas dans le monde réel, (BF) n’a rien de contraignant. Cette distinction philosophique permet de discriminer entre deux types de sémantiques distincts pour la logique modale du premier ordre.

Les sémantiques à domaine fixe

Une sémantique modale doit relativiser aux divers mondes possibles les valuations habituelles de la sémantique non modale. S’agissant de logique quantificative, l’interprétation d’un prédicat n -aire 﨏 dans le monde w sera donc une partie v(w , 﨏) de 阮n (où 阮 est le domaine de l’interprétation).

Dans le cas le plus simple, le domaine d’individus est fixe, c’est-à-dire commun à tous les mondes possibles. Une interprétation sera la donnée d’un quadruplet (W, face=F0021 倫, 阮, v) où v(w , A) est construite de la façon la plus naturelle: si l’opérateur principal de A n’est pas modal, on ne tient pas compte de w et on suit les définitions habituelles du calcul des prédicats; sinon, les définitions données dans le cadre de la logique modale propositionnelle restent valables.

(BF) est indécidable dans T et S4 (mais se démontre dans B et S5). Adjoindre (BF) à T et à S4 conduit à des versions «barcaniennes» TBF et S4BF de ces deux systèmes. TBF, S4BF, B et S5 sont précisément les systèmes caractérisés par ces interprétations à domaine fixe (lorsqu’on donne à 倫 les propriétés algébriques qui leur correspondent respectivement).

Les sémantiques à domaine variable

Si l’on adopte l’idée que le stock d’individus peut varier d’un monde possible à l’autre, la sémantique est fort différente. Une interprétation devient une structure (W, face=F0021 倫, 阮, f , v), où f : W戮(face=F0021 阮) est une application qui associe à chaque monde w le domaine 阮w des individus qui lui reviennent. La définition de v comportera la clause: v(w , 葉x Ax ) = V exactement si v(w , A ) = V pour tout 捻 阮w . En d’autres termes: lorsque je dis que tout est 﨏, je veux dire que tout est 﨏 dans mon monde. Mais comment déterminer si un individu qui n’existe pas dans ce monde a la propriété 﨏? Pégase a-t-il des rayures? Ici deux variantes sont possibles.

(I) Dans la première, l’attribution, en w , de la propriété 﨏 à un individu qui n’existe pas en w ne reçoit pas de valeur définie. On dira donc que v(w , 﨏 ) est V si 捻 阮w 惡 v(w , 﨏), F si 捻 阮w 惡 璉 阮v(w , 﨏) et non définie si 殮 阮w . On impose de plus le requisit d’inclusion : si ww , alors 阮w 念 阮w (aucun individu ne disparaît lorsqu’on suit les flèches d’accessibilité). Si v(w , A) est définie dans tous les mondes w accessibles à w , v (w , 撚 A) sera définie de la manière habituelle, et réputée indéfinie dans le cas contraire. Une formule M sera cependant déclarée vraie dans l’interprétation (W, face=F0021 倫, 阮, f , v) exactement si v(w , M) n’est F pour aucun w 捻 W (M peut donc être vraie même si elle est inévaluable dans certains mondes). Avec cette sémantique, (BF) est fausse lorsque la relation 倫 n’est pas symétrique, comme le montre le contre-exemple suivant:

En w , 葉x 撚 﨏x est vraie: il suffit que 撚 﨏a soit vrai, et c’est le cas. Mais 撚 葉xx y est faux , car 葉xx est faux en w . On notera l’asymétrie de 倫.

Appelons T BF/ et S4 BF/ les extensions non barcaniennes de T et S4. Les interprétations de la classe (I) caractérisent les systèmes T BF/, S4 BF/, B et S5 lorsque 倫 est dotée des propriétés algébriques qui les caractérisent respectivement (les sémantiques à domaine fixe et (I) conviennent donc toutes deux à B et à S5: lorsque 倫 est symétrique, le requisit d’inclusion assure que deux mondes accessibles l’un à partir de l’autre ont même domaine d’individus).

(II) La sémantique proposée par Kripke lui-même diffère essentiellement de la précédente sur deux points:

a ) Elle n’admet pas de valuations lacunaires: v(w , A ) sera définie même si 殮 阮w . Le principe d’instantiation « 葉xxb », qui est pourtant une thèse du calcul des prédicats, pourra donc se trouver faux (c’est le cas, en w , dans la figure précédente).

Tel est le point de départ de l’étude, aujourd’hui florissante, des logiques «libres» (J. Hintikka, K. Lambert, B. Van Fraassen): définissant un prédicat d’existence E tel que v(w , Ea ) = V exactement si a 捻 阮w , on donne au principe d’instantiation la forme (face=F0019 葉xx & Eb )﨏b («si toute chose est un 﨏, b aussi, à condition toutefois qu’il existe»).

Mais on peut aussi construire les versions quantificatives des systèmes de logique modale sur la base d’une version P 戀凉 du calcul des prédicats où le principe d’instantiation n’est pas retenu (les thèses de P 戀凉 étant simplement les clôtures universelles des thèses du calcul des prédicats classique). Or on montre que, même dans le système S 戀凉5 ainsi obtenu, ni (BF) ni sa converse:

ne sont démontrables (la démontrabilité des thèses ouvertes du calcul non modal détermine donc la démontrabilité de certaines formules closes du calcul modal!).

b ) Plus radicale encore que la sémantique (I), elle abandonne le «requisit d’inclusion». Intuitivement: du monde actuel aux mondes possibles des individus peuvent disparaître. Dès lors, cette sémantique invalide (BF) et (BF ) (la figure suivante donne un contre-exemple à (BF ) dans la sémantique de Kripke). Elle caractérise les systèmes T 戀凉, S 戀凉4, B 戀凉 et S 戀凉5 (face=F0019 葉xx est vrai en w et en w , donc nécessaire. Mais 葉x 撚 﨏x est faux en w (face=F0019 撚 﨏b est faux en w , puisque 﨏b est faux en w dans cette sémantique)).

8. Logiques non monotones

Explicitement formulées au début des années 1980 dans le cadre de l’intelligence artificielle, mais fondées sur une réflexion philosophique largement antérieure, les logiques non monotones cherchent à formaliser les raisonnements du type suivant: les individus typiques de la classe 﨏 ont la propriété 祥, donc si un individu est un 﨏 il est un 祥 (à moins d’indication contraire). Par exemple: les serpents sont dangereux, les hémoptysies sont d’origine pulmonaire, les gens autoritaires sont dogmatiques (sauf exception). Psychologiquement, ces raisonnements correspondent à des présomptions sur la base de données. Logiquement, ils consistent à tirer une conclusion à partir de données qui ne l’impliquent pas déductivement, la négation de la conclusion restant donc cohérente avec ces données. Aussi, cette variété de raisonnement se distingue-t-elle de l’inférence déductive usuelle sur un point essentiel. La relation classique de déduction, notée 塞, vérifie: si 阮 塞 H, alors 阮 聆 阮 塞 H. L’ensemble des conclusions croît avec l’ensemble des prémisses, c’est-à-dire que jamais l’ajout d’une prémisse n’oblige à retirer une conclusion: on dit que la relation 塞 est monotone (le terme «croissante» aurait peut-être mieux convenu). À l’inverse, les raisonnements mentionnés plus haut n’ont pas cette propriété: l’individu dont on présume qu’il est un 祥 peut se révéler un 﨏 atypique. Partout où l’extension des prémisses peut conduire au retrait d’une conclusion, on parlera de logique non monotone . Par analogie avec la situation dans laquelle une variable informatique qui n’a pas fait expressément l’objet d’une affectation reçoit une valeur par défaut, on qualifiera aussi ces raisonnements d’inférence par défaut (default reasoning ): la valeur de 祥 pour l’objet a qui est un 﨏 est, par défaut, le vrai.

Cette propriété de non-monotonie s’étend à d’autres domaines que l’inférence en termes d’objets typiques (il suffit de mentionner le raisonnement sous-jacent à la perception: si j’ai l’impression que p , alors je me dispose à agir comme si p (jusqu’à preuve du contraire, l’apparence est la réalité!). Mais, bien que les logiques non monotones semblent capables d’exprimer de façon assez prometteuse certaines propriétés importantes du raisonnement naturel, elles ont été surtout appliquées jusqu’ici au traitement de deux questions techniques de l’intelligence artificielle:

– La mise en œuvre des bases de données relationnelles. En ce domaine il paraît très économique d’adopter une hypothèse de monde clos , en vertu de laquelle on peut se contenter d’expliciter les relations qui existent entre les individus de la base: une relation entre individus doit être supposée absente chaque fois qu’il est cohérent de le faire (on ne représente que les informations positives, les autres sont inférées par défaut).

– La question du cadre de référence (frame ) dans la représentation des univers dynamiques: comment décrire la persistance de certaines situations au travers des modifications induites par les opérations d’un agent (par exemple, le fait que le déplacement d’un objet n’en change pas la couleur)? Là encore, l’intervention d’inférences non monotones permet d’économiser l’écriture d’un très grand nombre de conditions d’invariance associées à chaque action: si p est le cas maintenant, alors tout à l’heure aussi, sauf preuve du contraire.

Ces deux exemples montrent d’ailleurs que tout raisonnement formalisable en termes non monotones pourrait l’être de façon classique. Ainsi, à supposer que nous disposions d’une énumération e 1, ..., e n des objets atypiques de la classe 﨏, le raisonnement qui attribue à l’objet a la propriété 祥 pourrait être écrit:

Mais nous sommes peu intéressés par la liste de ces exceptions ou incapables de la dresser, et désireux malgré tout d’exploiter l’infomation que a est un 﨏.

Les systèmes de logique non monotones construits à ce jour comportent tous une composante classique (monotone). Supposons donc donnés:

– Un langage 硫 et une relation 塞 de conséquence entre ensembles (éventuellement vides) de formules de 硫, notés 遼, 龍,... La relation 塞 est supposée à la fois réflexive (A 塞 A), monotone (si 遼 塞 B, alors 遼, 遼 塞 B) et transitive (si 遼, X 塞 B et si 遼 塞 X, alors 遼 塞 B) (on écrit X pourX, et 遼, 龍 pour 遼 聆 龍). On dira que la relation 塞 est tarskienne , et on supposera en outre qu’elle vérifie le «théorème de la déduction»: face=F0021 遼, X 塞 B si, et seulement si, 遼 塞 XB.

– Un ensemble 阮 de formules de 硫 (les «faits» ou les «données»).

– Un ensemble 倫 de «règles» (default rules ) du type AH («si A est vrai, et si vous pouvez, sans contradiction, supposer que H est vrai, alors faites-le»). A est appelé le prérequis de la règle, et H son conséquent . Tous deux sont des formules de 硫. Une règle peut ne pas avoir de prérequis. On suppose donnée une énumération s 1, s 2, ... de ces règles (la k -ième étant écrite AkHk ).

Appelons Cl(face=F0021 阮) la clôture déductive de 阮, définie par: A 捻 Cl(face=F0021 阮) exactement si 阮 塞 A. On construit des extensions successives 1, 2, ... de Cl(face=F0021 阮) de la manière suivante. 0 = Cl(face=F0021 阮). Supposons Ti déjà construite. On examine les règles de 倫 en commençant par celles de plus petit indice. Si Ak 殮 Ti ou si 囹Hk 捻 Ti , passer à la règle suivante (s’il n’en reste plus, la construction est terminée). Sinon, Ti +1 = Cl(Ti 聆Hk). Une extension de au moyen des règles de 倫 (en abrégé: une extension de 麗 阮, 倫 礪) est un point fixe pour ce procédé (c’est-à-dire un ensemble Tn de formules tel que Tn = Tn +1). Un tel ensemble 劉 a les propriétés suivantes: il contient 阮, il est déductivement clos (pour la relation 塞), il est cohérent (si 阮 l’est déjà) et pour chaque règle Sk , Hk est dans 劉 si Ak y figure et pas 囹Hk .

Ces extensions ne sont pas uniques: leur construction dépend de l’énumération choisie pour 倫. Par exemple si 阮 =A囹B & 囹C, et 倫 =轢 A,B,C, 麗 阮, 倫 礪 a deux extensions distinctes: 劉1 = Cl(face=F0021 阮 聆 遼) et 劉2 = Cl(face=F0021 阮 聆B, C). 劉1 est obtenue lorsque la règleA est mobilisée en premier lieu, 劉2 lorsque les règlesB ouC sont considérées d’abord.

Ces extensions sont minimales: si 劉 聯 劉, alors 劉 = 劉. L’union de deux extensions distinctes est incohérente. Le qualificatif de «non-monotone» se justifie de la manière suivante: une extension de 麗 阮, 倫 礪 n’est pas, en général, une partie d’une extension de 麗 阮 聆 阮 , 倫 礪: dans l’exemple ci-dessus, 劉1 n’est contenue dans aucune extension de 麗 阮 聆囹A, 倫 礪. Par contre, si s 殮 倫, les extensions de 麗 阮, 倫 聆 崙礪 contiennent celles de 麗 阮, 倫 礪.

Intuitivement, chaque extension ajoute à 阮 un ensemble de croyances acceptables au sujet des aspects du monde sur lesquels 阮 ne nous renseigne pas. L’existence de plusieurs extensions distinctes de 麗 阮, 倫 礪, par elle-même tout à fait prévisible, peut donner lieu à trois stratégies différentes:

a ) Puisque l’existence de plusieurs extensions est due aux diverses manières d’énumérer les règles, il suffit de considérer l’ensemble 倫 de ces règles comme intrinsèquement ordonné (on donnera la priorité aux règles les plus «vraisemblables»). Cette perspective, envisagée par Reiter (1980), n’a guère été explorée jusqu’ici.

b ) McDermott et Doyle (1980) considèrent que le point crucial est de déterminer les formules communes à toutes les extensions. Mais, dans ce cas, on affaiblit considérablement la logique non monotone: il y a généralement peu d’énoncés qui soient dans toutes les extensions de 麗 阮, 倫 礪 sans être déductibles de 阮 (dans l’exemple ci-dessus, il n’y en a pas).

c ) Dans le système de Reiter (1980), on cherche au contraire à caractériser les énoncés qui figurent dans au moins une extension (l’idée sous-jacente est de collationner tous les énoncés crédibles, et de faire le tri ensuite). Le défaut est symétrique du précédent: trop d’énoncés seront inférés (la réunion des extensions de 麗 阮, 倫 礪 n’est pas cohérente).

Par ailleurs, les logiques non monotones soulèvent de sérieux problèmes d’effectivité . On peut montrer que H est dans une extension de 麗 阮, 倫 礪 exactement s’il existe une suite A0H0, ..., AnHn de règles extraites de 倫 telle que:

1: face=F0021 阮 塞 A0;

2: face=F0021 阮, H0 塞 A1; ...; 阮, Hn -1 塞 An ; 阮, Hn 塞 H;

3: face=F0021 阮 聆H0, ..., Hn est cohérent.

Or la troisième condition n’est pas décidable. La construction des extensions de 麗 阮, 倫 礪 fait intervenir des clauses du type: «retenir H, si 囹H n’est pas démontrable». Mais si 硫 est un langage du premier ordre (comportant des variables d’individus), il ne peut exister d’algorithme permettant de déterminer si la condition est satisfaite. En effet, la question de la démontrabilité pour la logique du premier ordre est seulement semi-décidable: il y a une énumération récursive des formules démontrables, mais l’ensemble des formules indémontrables n’est pas récursivement énumérable. Par conséquent, la question de savoir si une formule donnée figure ou non dans une extension de 麗 阮, 倫 礪 n’est même pas semi-décidable (contrairement à la question de savoir si la formule en question se démontre à partir de 阮). Ce défaut d’effectivité, redoutable lorsqu’il s’agit de mettre en œuvre une logique de ce type sur un ordinateur, n’a rien de philosophiquement scandaleux, à moins justement de considérer que le raisonnement naturel peut être en principe simulé par une machine...

L’utilisation d’une logique non monotone suppose d’autre part une stratégie de révision : lorsque de nouvelles propositions sont ajoutées à 阮 par suite de l’élargissement des connaissances, certaines propositions doivent être éliminées des extensions de 麗 阮, 倫 礪 (si j’ai un faisceau de présomptions pour incriminer X dans le meurtre de Y, et si j’apprends par la suite que X a un alibi inattaquable, je devrai réviser «X a tué Y», mais pas « §Z (Z a tué Y)»). C’est le problème de la maintenance de la cohérence des systèmes de croyance. Or on est actuellement fort loin de disposer d’une méthode générale pour déterminer les nouvelles extensions en fonction des anciennes. Lorsque l’information A est nouvellement acquise, il ne suffit évidemment pas de retirer la proposition 囹A, au cas où elle aurait été obtenue par une inférence non monotone: en général 囹A résulte de plusieurs autres propositions, et il y a de multiples façons de restaurer la cohérence du système (si 囹A se déduit de P & Q, on peut éliminer P, Q, ou les deux à la fois). Sur le plan technologique, ces révisions sont donc coûteuses en emplacements mémoire: on doit conserver, sous une forme ou sous une autre, une trace du processus par lequel 囹A a été inféré (il n’y a aucune difficulté semblable avec les logiques monotones, où le processus de démonstration peut être oublié sans dommage). Par ailleurs, l’étude formelle de la révision des systèmes d’énoncés (la «dynamique des théories ») est une entreprise encore trop récente (cf. Alchourron, Gärdenfors & Makinson, 1985, ainsi que Makinson, 1985) pour exercer sur la conception des logiques non monotones une influence décelable.

9. Logique de la pertinence

En 1918, C. I. Lewis dénonçait les «paradoxes» de l’implication matérielle, définie par «A 念 B est vrai sauf si A est vrai et B est faux»: une proposition fausse implique n’importe quelle proposition (face=F0019 囹A 念 (A 念 B)) et une proposition vraie est impliquée par n’importe quelle proposition (A 念 (B 念 A)). Lewis estimait, au contraire, que des expressions comme «A entraîne B» ou «si A, alors B», dans leur usage naturel, mettent en jeu une relation nécessaire entre A et B (A ne peut être vraie sans que B le soit) et une connexion de signification entre les deux (A doit contenir une information pertinente pour B). Aussi proposait-il de remplacer 念 par un opérateur d’implication stricte 蓼: A 蓼 B équivaut à 撚 (A 念 B) («il est nécessaire que A implique B»). Mais l’implication stricte donne lieu à des paradoxes du même ordre: en logique modale, on démontre 撚 A 念 (B 蓼 A) et 撚 囹A 念 (A 蓼 B). On s’accordait donc à reconnaître l’impossibilité de caractériser de manière formellement satisfaisante l’idée naturelle d’«entraînement» (entailment ).

Le problème a pris un tour nouveau dans les années 1950 avec les travaux de A. Church et, surtout, d’un ancien collaborateur de Hilbert, W. Ackermann. Suivant une suggestion de Lewis, l’entraînement est la relation converse de la déductibilité (A entraîne B lorsque B se déduit de A). De fait, dans la logique classique des propositions, le théorème de la déduction énonce que si A1, A2, ..., An 塞 B, alors A1, A2, ..., An -1 塞 An 念 B (face=F0019 塞 se lit «se déduit de»). Les «paradoxes» de l’implication reflètent donc les propriétés de la déduction usuelle, et en particulier la monotonie: si X 塞 Y, alors X, Z 塞 Y (on peut ajouter aux hypothèses d’une déduction n’importe quelle proposition «postiche»). De A 塞 A, on peut tirer A, B 塞 A et donc A 塞 B 念 A et 塞 A 念 (B 念 A) par le théorème de la déduction. La mise au point d’une logique de l’implication pertinente suppose donc ou bien une modification de la notion de déduction, dans laquelle seules les propositions «pertinentes», non «postiches» pourraient figurer comme hypothèses, ou bien une atténuation du théorème de la déduction, dans laquelle les propositions «postiches» ne pourraient plus passer à droite du symbole 塞. Or Church a proposé en 1951 un «système implicationnel faible» jouissant de la propriété suivante: si A1, A2, ..., An 塞 B, alors A1, A2, ..., An -1 塞 An 念 B lorsque An est «pertinente» pour B, et sinon A1, A2, ..., An -1 塞 B (ce système échappe aux «paradoxes»: A 念 (B 念 A) n’y est pas démontrable). Les formules «pertinentes» en question sont celles qui sont «actives» dans la déduction de B. Prawitz (1965) a montré que l’on pouvait caractériser de manière très simple la différence entre logique classique et logique de la pertinence (relevance ). La première admet sans restriction la règle de déduction «si 臨 塞 B, alors 臨 漣A 塞 A 念 B». La seconde restreint cette règle au cas où A est «actif», c’est-à-dire appartient à 臨.

Le système de Church est adéquat pour traiter de la pertinence. Reste à rendre compte de la nécessité. La référence essentielle est ici le système d’implication rigoureuse (strenge implikation ) proposé par Ackermann en 1956. Sa partie implicationnelle (limitée au connecteur 轢) est définie par les axiomes suivants:

Contrairement à Lewis, qui définissait la nécessité par 撚 A 沈 囹A 蓼 A, on peut considérer 撚 A comme une abréviation de (AA)A (l’idée sous-jacente est que AA est nécessaire, et que les conséquences d’une proposition nécessaire sont elles-mêmes nécessaires). Moyennant cette définition, le caractère nécessaire des «entraînements» est immédiatement assuré dans le système d’Ackermann puisque (AB)撚 (AB) en est un théorème (il suffit de remplacer C par AB dans l’axiome (3)).

Une question importante de la logique de la pertinence et le problème de Lewis : peut-on caractériser une notion d’entraînement munie des «bonnes» propriétés de pertinence et de nécessité par une définition de la forme AB 沈 撚 﨏 (A, B), où 﨏 serait un opérateur vérifonctionnel? (telle était bien la tentative de Lewis, qui prenait pour 﨏 le connecteur 念). R. K. Meyer a établi que la réponse est négative. Ce résultat, qui montre que l’entraînement est une relation d’un type tout à fait original entre propositions, explique à la fois l’état d’inachèvement de la théorie, comme l’intérêt et le scepticisme mêlés dont la logique de la pertinence est actuellement l’objet.

10. Logique temporelle

Issue pour l’essentiel des travaux de A. N. Prior à la fin des années 1950, la logique temporelle a pour objet le traitement formel des énoncés grammaticalement temporalisés et des énoncés qui, tout en étant formulés au présent intemporel, se réfèrent à des événements datés, passés ou futurs. Des préoccupations de cet ordre sont toutefois décelables dès l’Antiquité, notamment dans l’école de Mégare et chez les stoïciens. On trouve chez les premiers mégariques une reformulation de la notion aristotélicienne de nécessité en termes d’omnitemporalité: A est nécessaire s’il est toujours réalisé. C’est la première apparition de l’idée que la logique modale propositionnelle pourrait être reformulée dans un cadre extensionnel moyennant une quantification sur les instants du temps. Mais Diodore Cronos (IVe s. av. J.-C.) exerce une influence plus décisive encore en proposant une nouvelle définition du possible en termes de temporalité: une proposition est possible si elle est vraie ou le sera. Cette définition, très discutée dans l’Antiquité, semble entraîner une sorte de fatalisme: est-il vrai que, à chaque instant, j’ai le choix entre plusieurs actions possibles puisque, si je n’accomplis pas, présentement ou dans le futur, une action donnée, cette action n’est tout simplement pas possible...?

On distingue aujourd’hui deux variétés de logique temporelle: la logique chronologique (ou logique de la datation) et la logique du temps grammatical (tense logic ).

Logique chronologique

L’opérateur fondamental est le foncteur de datation noté Tt (Tt (A) se lit «A est vrai à l’instant t »). Le système de base est la logique topologique de Rescher et Garson (1968). Sa partie propositionnelle est définie par l’ajout, aux axiomes usuels, des énoncés:

et par l’ajout, aux règles d’inférences habituelles, de la règle:

Logique du temps grammatical

À l’inverse de la situation qui prévaut en logique chronologique, la valeur de vérité des propositions n’est plus ici immuable, mais relative aux divers instants que l’on considère. Le langage 硫T de la logique temporelle propositionnelle, à laquelle on se limitera ici, est l’extension du langage de la logique propositionnelle usuelle qui admet les formules HA, GA, PA, FA pour chaque formule A. HA, GA, PA, FA se lisent respectivement: «il s’est toujours trouvé que A», «ce sera toujours le cas que A», «il s’est trouvé (au moins une fois) que A», «il se trouvera (au moins une fois) que A». On peut, en principe, se dispenser de G et de H: GA équivaut à 囹F 囹A et HA équivaut à 囹P 囹A. Ce langage s’interprète dans une structure temporelle 麗T, 倫, v), où T est un ensemble non vide d’instants, 倫 une relation sur T («antérieur à») et v : T 憐 硫T索V, F une valuation satisfaisant aux conditions suivantes:

On dit que A est vraie dans la structure 麗T, 倫, v 礪 si v(t , A) = V pour tout t 捻 T. De la même façon qu’en logique modale, on obtient diverses logiques selon les propriétés que l’on attribue à la relation 倫.

La logique temporelle minimale KT (Lemmon, 1965) est obtenue lorsque aucune restriction n’est imposée à 倫. KT est axiomatisé de la manière suivante: aux axiomes de la logique propositionnelle usuelle, il convient d’adjoindre les axiomes:

Aux règles d’inférences usuelles seront ajoutées les deux règles: si 塞A, alors 塞HA et si 塞A alors 塞GA («tout ce qui est prouvable est toujours vrai, dans l’avenir comme dans le passé»).

Tous les autres systèmes de logique temporelle sont des extensions de KT. Si l’on demande que la relation 倫 soit transitive, ce qui est manifestement une composante de la notion intuitive de temporalité, on obtient des structures temporelles caractérisées par le système CR de Cocchiarella (1965). CR résulte de l’ajout aux axiomes précédents de:

On exclut généralement que le temps soit ramifié dans le passé: le temps qui s’est écoulé est censé être linéaire. Donc, deux instants t et t tels que tt et tt doivent vérifier l’une des trois relations tt , t = t ou tt . Cette propriété de rétro-linéarité est assurée par l’axiome:

On vérifiera que cette formule est en défaut à l’instant t dans la structure «rétro-ramifiée» ci-dessous (avant t 0, A et B sont vrais, mais jamais au même instant, et A & PB et PA & B ne sont jamais réalisés):

On peut, de la même manière, ajouter un axiome d’anté-linéarité , qui garantit que le temps ne se ramifie pas dans le futur:

Les axiomes (1)-(7) constituent le système CL (ou K1) de Cocchiarella (logique minimale linéaire ). Intuitivement, le dernier axiome est moins justifié, car il paraît conduire à une forme de fatalisme: s’il y a un seul avenir, où est la liberté de l’action? Aussi Rescher et Urquhart adoptent-ils les axiomes (1)-(6) et la négation de l’axiome (7) dans leur système Kb (logic of branching time ). En ajoutant à CL les deux axiomes:

on obtient le système SL (ou Ks ) de D. Scott (1965). Le temps est alors infini dans les deux sens: pour tout t 捻 T, il existe t et t 捻 T tels que tt et tt . Si l’on exige en outre que le temps soit dense , c’est-à-dire qu’entre deux instants t et t il y en ait un troisième t , on adoptera l’axiome:

qui est invalide dans une structure discrète comme la suivante:

De l’ajout de l’axiome (10) au système SL, résulte le système du temps rationnel PL (ou Kp ) de A. N. Prior (1965). Par ailleurs, on peut définir une extension Kc du système PL qui caractérise un temps continu (ayant la structure d’ordre de l’ensemble des nombres réels). Enfin, l’ajout au système PL des axiomes:

donne lieu au système PCr du temps circulaire , également dû à Prior.

Encyclopédie Universelle. 2012.

Regardez d'autres dictionnaires:

  • NON-ET — Fonction logique Pour les articles homonymes, voir combinatoire (homonymie). Cet article se place d emblée dans le cadre de la logique classique. Il existe deux grands types de fonctions logiques : les fonctions logiques… …   Wikipédia en Français

  • Fonctions logiques — Fonction logique Pour les articles homonymes, voir combinatoire (homonymie). Cet article se place d emblée dans le cadre de la logique classique. Il existe deux grands types de fonctions logiques : les fonctions logiques… …   Wikipédia en Français

  • Portes Logiques — Fonction logique Pour les articles homonymes, voir combinatoire (homonymie). Cet article se place d emblée dans le cadre de la logique classique. Il existe deux grands types de fonctions logiques : les fonctions logiques… …   Wikipédia en Français

  • Portes logiques — Fonction logique Pour les articles homonymes, voir combinatoire (homonymie). Cet article se place d emblée dans le cadre de la logique classique. Il existe deux grands types de fonctions logiques : les fonctions logiques… …   Wikipédia en Français

  • Analyse Des Logiques Subjectives — L analyse des logiques subjectives est une méthode originale d’analyse du discours. Sommaire 1 Présentation sommaire de l’Analyse des Logiques Subjectives (A.L.S.) 1.1 Définition 1.2 Les séries (déf …   Wikipédia en Français

  • Analyse des Logiques Subjectives — L analyse des logiques subjectives est une méthode originale d’analyse du discours. Sommaire 1 Présentation sommaire de l’Analyse des Logiques Subjectives (A.L.S.) 1.1 Définition 1.2 Les séries (déf …   Wikipédia en Français

  • Analyse des logiques subjectives — L analyse des logiques subjectives est une méthode originale d’analyse du discours. Sommaire 1 Présentation sommaire de l’Analyse des Logiques Subjectives (A.L.S.) 1.1 Définition 1.2 Les séries (déf …   Wikipédia en Français

  • ANALYSE NON STANDARD — Créée par Abraham Robinson vers 1961 à partir de la théorie des modèles, l’analyse non standard (A.N.S.) est longtemps restée une affaire de logicien. Depuis quelques années, son usage comme outil de recherche et de démonstration rend accessibles …   Encyclopédie Universelle

  • ÉPISTÉMOLOGIE — Si l’on traduit par notre mot «science» le mot grec 﨎神晴靖精兀猪兀, l’épistémologie est, étymologiquement, la théorie de la science. Bien que la forme anglaise du vocable ait existé avant que le français ne l’assimile, c’est pourtant avec le sens… …   Encyclopédie Universelle

  • modal — modal, ale, aux [ mɔdal, o ] adj. et n. f. • 1546; de 2. mode ♦ Du mode. 1 ♦ Philos. Vx Qui a rapport aux modes de la substance. Existence modale. Logique modale. ⇒ 2. mode. 2 ♦ Gramm. Relatif aux modes des verbes. Forme, valeur modale. 3 ♦ Mus.… …   Encyclopédie Universelle